Storm開發中易犯的 小錯誤

Storm開發中易犯的 小錯誤

Storm是一個分佈式的、容錯的實時計算系統,遵循Eclipse Public License 1.0,Storm可以方便地在一個計算機集羣中編寫與擴展複雜的實時計算,Storm之於實時處理,就好比Hadoop之於批處理。Storm保證每個消息都會得到處理,而且它很快——在一個小集羣中,每秒可以處理數以百萬計的消息。可以使用任意編程語言來做開發。

Storm的優點
1. 簡單的編程模型。類似於MapReduce降低了並行批處理複雜性,Storm降低了進行實時處理的複雜性。
2. 服務化,一個服務框架,支持熱部署,即時上線或下線App.
3. 可以使用各種編程語言。你可以在Storm之上使用各種編程語言。默認支持ClojureJavaRubyPython。要增加對其他語言的支持,只需實現一個簡單的Storm通信協議即可。
4. 容錯性。Storm會管理工作進程和節點的故障。
5. 水平擴展。計算是在多個線程、進程和服務器之間並行進行的。
6. 可靠的消息處理。Storm保證每個消息至少能得到一次完整處理。任務失敗時,它會負責從消息源重試消息。
7. 快速。系統的設計保證了消息能得到快速的處理,使用ZeroMQ作爲其底層消息隊列。
8. 本地模式。Storm有一個“本地模式”,可以在處理過程中完全模擬Storm集羣。這讓你可以快速進行開發和單元測試。

然而,在開發的過程中,由於Stormkill Topology,常常會導致一些莫名的錯誤,比如下面的一個錯誤:

wKiom1gARRWgkW9NAAFt-FyX4kk062.png

造成異常的原因就是,

沒有kill 正在運行的topology卻先kill nimbussupervisorstorm進程

解決方案:

刪除了配置中"storm.local.dir"的文件夾內的內容(這個是導致ERROR的主要原因)

Zookeeper客戶端下   delete   /storm/assignments

Zookeeper客戶端下   delete   /storm/workerbeats

刪除 storm目錄下的workdir(即配置文件中配置的將TOPOLOGY序列化所放置的文件夾)


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章