摘要:在2019大數據技術公開課第一季《技術人生專訪》中,阿里巴巴雲計算平臺高級技術專家苑海勝爲大家分享了《MaxCompute 與大數據查詢引擎的技術和故事》,主要介紹了MaxCompute與MPP Database的異同點,分佈式系統上Join的實現,且詳細講解了MaxCompute針對Join和聚合引入的Hash Clustering Table和Range Clustering Table的優化。
以下內容根據演講視頻以及PPT整理而成。
一、MaxCompute VS MPP Database
MaxCompute 與 MPP Database有非常大的不同,主要體現在性能(Performance)、成本(Cost)、可擴展性(Scalability)及靈活性(Flexibility)等度量緯度。
- 性能(Performance)