面试题 3.一个有十亿条记录的文本文件,已经按照关键字排好序存储,设计算法,可以从文件中快速查找指定关键字的记录

3.一个有十亿条记录的文本文件,已经按照关键字排好序存储,设计算法,可以从文件中快速查找指定关键字的记录。

答: 十亿条记录对应的数据量在GB量级,分成100份,每份10MB 放入内存无压力
每份第一条记录关键字和此纪录对应文件偏移量扫入内存 随机IO100次
很快就能定位出指定关键字所在的记录块 然后把相应记录块拿到内存 二分法朝朝

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章