百度無人駕駛apollo項目分佈式改造初探

百度無人駕駛apollo項目分佈式改造初探


ros本身是分佈式的,但是和高併發高可靠的互聯網分佈式系統比,它又缺少了很多,分佈式模塊和消息中間件缺乏高可靠設計,沒有監控 跟蹤 報警模塊,也不支持分佈式緩存來保證數據高吞吐


1 使用zookeeper,保證ros 節點主從雙備,主節點發生故障,隨時切換到備份節點


2 引入系統實時監控和報警系統,並使用智能ai技術進行故障異常預測和定位甚至自動解決,引入分佈式系統調用跟蹤系統,可以跟蹤不同子服務的調用鏈,並發現耗費時間最長的服務並報警,這個可以叫無人駕駛系統的智能運維



3 引入分佈式緩存系統和c++高性能序列庫,ros所有的數據都是通過本地內存來存放的,這既影響性能,數據量大時也容易出故障,可以先將數據通過序列化存儲到分佈式緩存系統,需要的子服務直接從分佈式緩存系統讀取數據並反序列化


4 改造ros的消息中間件,能達到類似rocketmq或kafka的高可靠高性能


這些只能自己改造,而不可能依靠ros組織,因爲引入這些系統,爲了保障可靠性,至少需要3臺高性能計算機,ros組織的主要目的還是支持工業機器人,部署就需要3臺高性能計算機肯定和它們的主要目的是不一致,但這對無人駕駛系統是沒有問題的,因爲無人汽車空間大,提供的電力充足


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章