spark core源碼分析13 異常情況下的容錯保證

原創

2020-06-21 09:00

standalone模式下的框架圖如下：

異常分析1： worker異常退出

worker異常退出，比如說有意識的通過kill指令將worker殺死
worker在退出之前，會將自己所管控的所有小弟executor全乾掉
worker需要定期向master改善心跳消息的，現在worker進程都已經玩完了，哪有心跳消息，所以Master會在超時處理中意識到有一個“分舵”離開了
Master非常傷心，傷心的Master將情況彙報給了相應的Driver
Driver通過兩方面確認分配給自己的Executor不幸離開了，一是Master發送過來的通知，二是Driver沒有在規定時間內收到Executor的StatusUpdate，於是Driver會將註冊的Executor移除

Executor作爲Standalone集羣部署方式下的最底層員工，一旦異常退出，其後果會是什麼呢？

帶頭大哥如果不在了，會是什麼後果呢？

個人覺得這位同學講的很是生動形象！！！點個贊

引用：http://www.cnblogs.com/hseagle/p/3791779.html

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.