https://blog.csdn.net/v_july_v/article/details/7382693
- 分而治之/hash映射 + hash统计 + 堆/快速/归并排序;(分内存对象、分表、分文件存储)
- 双层桶划分
- Bloom filter/Bitmap;查存在、查重对比.....
- Trie树/数据库/倒排索引;
- 外排序 归并结果;
- 分布式处理之Hadoop/Mapreduce。
https://blog.csdn.net/v_july_v/article/details/7382693