yarn.reallocate-failed
集羣中TaskManager失敗後是否被重新拉起,設定爲True表示新分配資源並拉起失敗的TaskManager,默認爲True,本質上是Yarn是否重新分配Taskmanager的Container
yarn.maximun-failed-containers
該參數表示集羣所能容忍失敗Container數量的最大值,如果超過該參數,則會直接導致整個Session集羣失敗並停止,參數默認值爲TaskManager數量,也就是用戶啓動集羣提交任務時-n參數對應的值
yarn.application-attempts
整個Session集羣所在的Yarn Application失敗重啓的次數,如果Session集羣所在的整個應用失敗,則在該參數範圍內,Yarn也會重新拉起相應的Application,但如果重啓次數超過該參數,Yarn不會再重啓應用,此時整個Flink Session會失敗,與此同時Session上提交的任務也會全部停止