关注Google的几个技术

关注Google的技术,
http://research.google.com/pubs/papers.html#category4
Google论文--关于分布式和并行计算,
Google的几个核心技术,
1 集群设计和管理
2 Google File System
3 MapReduce(典型的并行计算工具)
典型应用:
类似于grep的工作,日志分析,web-link的反向分析
Google网页的索引是建立在一系列的MapReduce工作上,前一个MR的输出是后一个MR的输入.
输入和输出都是中间临时文件

4 Sawzall(用以并行计算的描述性语言)
建立在MapReduce的基础上,可以认为是分布式的awt
5 BigTable(结构化的存储系统)
一个Google自己做的数据库,建立在GFS,workqueue,MP的基础上
类似一个电子表格,但是是多维的,以时间为维度,为了保存变换。
被GoogleMap,Search History使用

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章