面試題 3.一個有十億條記錄的文本文件,已經按照關鍵字排好序存儲,設計算法,可以從文件中快速查找指定關鍵字的記錄

3.一個有十億條記錄的文本文件,已經按照關鍵字排好序存儲,設計算法,可以從文件中快速查找指定關鍵字的記錄。

答: 十億條記錄對應的數據量在GB量級,分成100份,每份10MB 放入內存無壓力
每份第一條記錄關鍵字和此紀錄對應文件偏移量掃入內存 隨機IO100次
很快就能定位出指定關鍵字所在的記錄塊 然後把相應記錄塊拿到內存 二分法朝朝

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章