spark性能調優三--shuffle調優

shuffle原理

001.PNG-42.2kB

002.PNG-66.5kB

003.PNG-95.8kB

一,合併map端輸出文件

SparkConf conf = new SparkConf()
                .setAppName(Constants.SPARK_APP_NAME_SESSION)
                .setMaster("local")
                .set("spark.default.paralelism", "500")
                .set("spark.locality.wait","10")
                .set("spark.storage.memoryFraction","0.5")
                .set("spark.shuffle.consolidateFiles", "true")
                .set("spark.serializer","org.apache.spark.serializer.KryoSerializer")
                .registerKryoClasses(new Class[]{CategorySortKey.class});

001.PNG-39.6kB

002.PNG-81.4kB

003.PNG-84.1kB

004.PNG-73.3kB

005.PNG-31kB

006.PNG-56.9kB

二,調節map端緩存大小和reduce端緩存佔比

001.PNG-40.9kB

002.PNG-31.5kB

003.PNG-71.4kB

004.PNG-109kB

005.PNG-79.5kB

三,HashShuffleManage和SortedShuffleManage的調節

001.PNG-34.8kB

002.PNG-77.8kB

003.PNG-69.4kB

004.PNG-115.3kB

發佈了85 篇原創文章 · 獲贊 6 · 訪問量 10萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章