梳理spark中shuffle操作HashShuffleManager和SortShuffleManager的原理

spark中的shuffleManager是負責shuffle過程的執行,計算和處理的組件.shuffleManager是trait,主要實現類有兩 個:一個是HashShuffleManager,另外一個是SortShuffleManager.

一、HashShuffleManager和SortShuffleManager的關鍵區別

  • HashShuffleManager在1.2版本之前是默認使用的shuffle版本,SortShuffleManager是1.2版本之後的默認shuffle方式。
  • hash
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章