導語:雖然detection在classification基礎上煥發了春天,但算法的複雜度確實增加了不少。對於底層平臺來說,雖然看起來還是一堆卷積,但圖片的增大,帶來了一些列問題。
目標檢測object detection由於除了要識別what,還要找出where,從算法本身上覆雜了許多。雖然最終實現端到端檢測的網絡是一個卷機網絡,貌似和之前沒有多大差別,但大圖片除了計算量增加xx倍意外,圖片的搬移纔是給底層計算平臺帶來的最大挑戰,高效的數據搬移重要性浮出水面,設計的中心從“計算爲主”逐步切換到“計算加搬移”並重。
對底層平臺來說,核心在於理解: 1. 爲什麼圖片在object detection下越來越大,這個是不是其核心訴求?答案是,這個是第一訴求,從應用場景看,detection本身就是識別多個物體,提取出小圖片來識別的代價太大;同時應用中物體的遠近不等,大圖片採集更大的視野也是一個主要原因。但同時一個利好因素是,在端側應用,受限於人眼的識別能力,圖片識別的張數要遠比在服務器側壓力小。 2. 功耗的額要求:在機器人、無人車等應用中,和服務器端相比,功耗是一個關鍵因素。