spark性能调优三--shuffle调优

shuffle原理

001.PNG-42.2kB

002.PNG-66.5kB

003.PNG-95.8kB

一,合并map端输出文件

SparkConf conf = new SparkConf()
                .setAppName(Constants.SPARK_APP_NAME_SESSION)
                .setMaster("local")
                .set("spark.default.paralelism", "500")
                .set("spark.locality.wait","10")
                .set("spark.storage.memoryFraction","0.5")
                .set("spark.shuffle.consolidateFiles", "true")
                .set("spark.serializer","org.apache.spark.serializer.KryoSerializer")
                .registerKryoClasses(new Class[]{CategorySortKey.class});

001.PNG-39.6kB

002.PNG-81.4kB

003.PNG-84.1kB

004.PNG-73.3kB

005.PNG-31kB

006.PNG-56.9kB

二,调节map端缓存大小和reduce端缓存占比

001.PNG-40.9kB

002.PNG-31.5kB

003.PNG-71.4kB

004.PNG-109kB

005.PNG-79.5kB

三,HashShuffleManage和SortedShuffleManage的调节

001.PNG-34.8kB

002.PNG-77.8kB

003.PNG-69.4kB

004.PNG-115.3kB

发布了85 篇原创文章 · 获赞 6 · 访问量 10万+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章