Flink集群之Flink Session On Yarn容错配置

yarn.reallocate-failed

集群中TaskManager失败后是否被重新拉起,设定为True表示新分配资源并拉起失败的TaskManager,默认为True,本质上是Yarn是否重新分配Taskmanager的Container

yarn.maximun-failed-containers

该参数表示集群所能容忍失败Container数量的最大值,如果超过该参数,则会直接导致整个Session集群失败并停止,参数默认值为TaskManager数量,也就是用户启动集群提交任务时-n参数对应的值

yarn.application-attempts

整个Session集群所在的Yarn Application失败重启的次数,如果Session集群所在的整个应用失败,则在该参数范围内,Yarn也会重新拉起相应的Application,但如果重启次数超过该参数,Yarn不会再重启应用,此时整个Flink Session会失败,与此同时Session上提交的任务也会全部停止

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章