SparkStreming：使用Checkpoint創建StreamingContext修改executor-cores、executor-memory等資源信息不生效。

原創

2019-08-18 01:04

在使用SparkStreaming時，使用StreamingContext.getOrCreate(checkpointDirectory, functionToCreateContext _)創建StreamingContext。代碼示例如下：

// Function to create and setup a new StreamingContext
    def functionToCreateContext(): StreamingContext = {

      val conf = new SparkConf().setAppName("UserBrowse")
      val ssc = new StreamingContext(conf, batchInterval)

      //通過LogHubCursorPosition.BEGIN_CURSOR指定消費Cursor的模式。
      val loghubStream = LoghubUtils.createStream(...)

      loghubStream.checkpoint(batchInterval * 5).foreachRDD { rdd =>

      val spark = SparkSession.builder.config(rdd.sparkContext.getConf)
          .config("spark.serializer", "org.apache.spark.serializer.KryoSerializer")
          .getOrCreate()
      }

      ssc.checkpoint(checkpointDirectory) // set checkpoint directory
      ssc
    }
    // Get StreamingContext from checkpoint data or create a new one
    val context = StreamingContext.getOrCreate(checkpointDirectory, functionToCreateContext _)

此時通過控制檯提交Spark任務命令如下：

--class com.test.StreamingText
--jars /spark-it/loghub-spark-0.6.13_2.4.3-1.0.4.jar,/spark-it/loghub-client-lib-0.6.13.jar
--driver-memory 1G 
--driver-cores 1
--executor-cores 3 
--executor-memory 3G
--num-executors 1
--name spark_on_loghub
/spark-it/sparkstreaming-0.0.1-SNAPSHOT.jar
/tmp/checkpoint_location_test

其中/tmp/checkpoint_location_test 爲StreamingContext的checkpoint路徑。
運行一段時間後，用戶期望修改executor-cores爲4，executor-memory 爲12G，num-executors爲3。那如何修改呢？
由於SparkStreming的運行機制是長久運行，以及checkpoint的設置是爲了任務異常能從checkpoint恢復數據。
首次提交任務後，StremingContext會把Spark的配置信息寫入到Checkpoint中，包括：executor-cores、num-executors、executor-memory等配置信息。
當任務異常或者重啓後，StremingContext會從Checkpoint中讀取Spark的配置信息。所以這時如果在控制檯修改executor-cores、executor-memory等配置信息，StremingContext不會讀取的。
如果需要修改executor-cores、executor-memory等配置信息需要清除Checkpoint路徑，或者重新指定一個新的Checkpoint路徑。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

SparkStreming：使用Checkpoint創建StreamingContext修改executor-cores、executor-memory等資源信息不生效。

985 碩士程序員，空窗 4 個月沒有 Offer！

營銷系統黑名單優化：位圖的應用解析

我真的從測試轉成了開發......

nginx添加相應配置，通過瀏覽器訪問或curl時返回客戶端對應公網IP

[oeasy]python020在遊戲中體驗數值自由_勇闖地下城_終端文字遊戲

爲何我建議你學會抄代碼

解密遊戲神作

導入地址表鉤取技術解析

盛大發布 | Zabbix 7.0 LTS--性能與擴展的卓越融合

mmsql 臨時表和主表 merge into 語法

X-Pack Spark 訪問OSS

SparkStreming：使用Checkpoint創建StreamingContext修改executor-cores、executor-memory等資源信息不生效。

Spark on HBase Connector：如何在Spark側設置HBase參數

X-Pack Spark使用[FAQ]

Spark用戶手冊

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結