--- spark的job在yarn的資源分配

原創

2020-06-21 09:58

資源

現在有6臺機器每臺機器16個core 64g的內存

資源分配

6Node 16core/臺 64g/臺

現可用資源一共96個core 384g ；每臺機器預留1core和1g；那麼剩下90個core 378g的可用資源

分配core

core=5 官方定義超過5會對hdfs吞吐量造成影響
也就是說每個executor最多可以同時運行5個core

分配executor

用剩餘的core除以每個executor的最大使用量 90/5=18
executor=18-1 applicationmaster會用一個；預留1個給它
故最後作業可以使用的最大executor數量爲17

分配memory

可用的memory除以executor的總數；減去memoryOverhead的佔用量就是剩餘的作業每個executor可以申請的最大memory

memory = 19 （378/18）X 0.93 向下取整是19

注意：因爲executor container裏由spark.yarn.executor.memoryOverhead和spark.executor.memeory兩部分構成；其中memoryOverhead佔了0.07剩下的就是spark.executor.memeory=19的了。

注意，在Spark-1.6.1中0.07已經改成了0.1

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

博客目錄——Spark學習筆記

更新時間：2019-03-07 Python API 【PySpark學習筆記一】彈性分佈式數據集RDD 【PySpark學習筆記二】DataFrame用法【PySpark學習筆記三】spark-submit詳解 Scala

2020-07-07 01:31:07

Ubuntu安裝IDEA、配置SCALA/SPARK環境、解決pom文件無法加載依賴庫的問題

Ubuntu安裝IDEA、配置SCALA/SPARK環境、解決pom文件無法加載依賴庫的問題前言1. 安裝jdk2. 安裝scala3. 安裝IDEA4. 安裝scala插件5. 解決依賴包無法下載的問題前言一般情況下，習慣於

2020-06-29 11:08:44

Spark操作——行動操作(一)

集合標量行動操作存儲行動操作集合標量行動操作 first(): T 返回RDD中的第一個元素，不進行排序 count(): Long 返回RDD中的元素個數 reduce(f:(T, T) => T):

2020-06-26 21:16:53

Spark操作——行動操作(二)

集合標量行動操作存儲行動操作存儲行動操作 saveAsTextFile(path: String): Unit saveAsTextFile(path: String, codec: Class[_ <: Compr

2020-06-26 21:16:53

Spark操作——轉換操作(三)

2020-05-23 18:12:55

Spark操作——控制操作

2020-05-23 18:12:54

Spark學習筆記——轉換操作(四)

2020-05-23 18:12:54

Spark操作——創建操作

2020-05-17 02:58:40

Spark操作——轉換操作(一)

2020-05-17 02:58:40

Spark操作——轉換操作(二)

2020-05-17 02:58:40

Spark學習筆記(5) - Spark連接HBase進行交互 - Get / Put 數據

2068年的王天赐

2020-02-22 07:52:14

Spark學習筆記(4) - 關於Spark常用31個transform算子代碼總結以及使用方法介紹(帶目錄)

2068年的王天赐

2020-02-22 07:52:14

Kafka踩坑筆記 - SparkStreaming連接 Kafka出現KafkaConsumer is not safe for multi-threaded access錯誤

2068年的王天赐

2020-02-22 07:52:14

博客目錄——Spark學習筆記

更新時間：2019-03-07 Python API 【PySpark學習筆記一】彈性分佈式數據集RDD 【PySpark學習筆記二】DataFrame用法【PySpark學習筆記三】spark-submit詳解 Scala

2020-07-07 01:31:07

Ubuntu安裝IDEA、配置SCALA/SPARK環境、解決pom文件無法加載依賴庫的問題

Ubuntu安裝IDEA、配置SCALA/SPARK環境、解決pom文件無法加載依賴庫的問題前言1. 安裝jdk2. 安裝scala3. 安裝IDEA4. 安裝scala插件5. 解決依賴包無法下載的問題前言一般情況下，習慣於

2020-06-29 11:08:44

24小時熱門文章

最新文章

最新評論文章