海量大数据处理

https://blog.csdn.net/v_july_v/article/details/7382693

  1. 分而治之/hash映射 + hash统计 + 堆/快速/归并排序;(分内存对象、分表、分文件存储)
  2. 双层桶划分 
  3. Bloom filter/Bitmap;查存在、查重对比.....
  4. Trie树/数据库/倒排索引;
  5. 外排序 归并结果;
  6. 分布式处理之Hadoop/Mapreduce。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章