Flink集羣之Flink Session On Yarn容錯配置

yarn.reallocate-failed

集羣中TaskManager失敗後是否被重新拉起,設定爲True表示新分配資源並拉起失敗的TaskManager,默認爲True,本質上是Yarn是否重新分配Taskmanager的Container

yarn.maximun-failed-containers

該參數表示集羣所能容忍失敗Container數量的最大值,如果超過該參數,則會直接導致整個Session集羣失敗並停止,參數默認值爲TaskManager數量,也就是用戶啓動集羣提交任務時-n參數對應的值

yarn.application-attempts

整個Session集羣所在的Yarn Application失敗重啓的次數,如果Session集羣所在的整個應用失敗,則在該參數範圍內,Yarn也會重新拉起相應的Application,但如果重啓次數超過該參數,Yarn不會再重啓應用,此時整個Flink Session會失敗,與此同時Session上提交的任務也會全部停止

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章