IBM爲機器學習開發低功耗,高性能的視覺系統

 

內容來源:ATYUN AI平臺

機器學習算法近年來有了突飛猛進的發展。例如,像Facebook這樣的最先進的系統 可以在一小時內訓練圖像分類算法,而不會犧牲準確性。但其中許多人都接受過使用強大GPU的高端機器的訓練,隨着物聯網(IoT)產業向邊緣計算髮展,對低功耗低成本人工智能模型的需求不斷增長。

IBM有前景的研究爲更高效的算法奠定了基礎。在CVPR會議上,該公司的研究人員發表兩篇論文,分別介紹圖像分類處理。

BlockDrop

第一個標題爲“BlockDrop: Dynamic Interference Paths in Residual Networks”,建立在微軟在2015年發佈的有關Residual networks的工作基礎上。Residual networks(簡稱ResNets)引入了神經網絡中各層之間的身份連接,允許它們在訓練過程中學習增量或殘餘。

IBM將這一想法向前推進了一步。科學家們引入了一個輕量級的二級神經網絡,在本文中稱爲“策略網絡”,在預先訓練的ResNet中動態地丟棄殘餘塊。爲了確保性能收益不以精確爲代價,策略網絡使用最少數量的塊訓練並保持識別準確性。

IBM研究經理Rogerio Feris表示,“一般來說,如果向模型添加更多圖層,可以提高其準確性,但是會增加計算成本,目前大多數模型的一個問題是,有一個通用的網絡,在所有圖像中都使用相同的計算。我們的系統可以更有效地分配資源,並準確地識別圖像。”

BlockDrop將圖像分類平均加快了20%,在某些情況下加快了36%,同時保持了76.4%的準確性。

論文網址:arxiv.org/abs/1711.08393

改善立體視覺

第二篇論文“A Low Power, High Throughput, Full Event-Based Stereo System”解決了圖像處理中的另一個問題:立體視覺。

正如IBM研究員Alexander Andreopoulos解釋的那樣,人類的眼睛相距幾釐米,從略微不同的角度看世界。大腦的視覺皮層將兩隻眼睛的圖像無縫融合爲一體,使我們能夠感知深度,但雙攝像機器人系統在協調視差方面更困難。

“在計算機視覺的情況下,相機鏡頭有異常,這會導致噪音並使問題複雜化,”Andreopoulos說。

研究人員的解決方案是:運行在IBM TrueNorth神經形態芯片上的系統,該系統具有針對機器學習模型進行了優化的高度並行化架構。系統使用九個處理器的集羣,一對基於事件的攝像頭(當它們檢測到運動時只拍攝圖像的攝像頭)以及一臺將計算分配給上述芯片的筆記本電腦,每秒算法捕獲並處理400(最多達2,000)視差圖。

Andreopoulos解釋說,基於事件的攝像機的使用大大減少了帶寬和能源消耗。“立體聲算法已經存在了30多年,但大多數系統都採用積極的方法來感知世界。我們使用的方法很被動。”

總體而言,與具有高幀速率照相機的最先進系統相比,該系統在每個像素的每像素功率方面的性能提高了200倍。

這些結果爲依靠低功耗,低延遲深度信息來導航世界的機器人系統帶來希望。

論文網址:researcher.watson.ibm.com/researcher/files/us-aandreo/cvpr2018.pdf

本文轉自ATYUN人工智能媒體平臺,原文鏈接:IBM爲機器學習開發低功耗,高性能的視覺系統

更多推薦

英特爾推出其Nervana推理和訓練芯片,首款AI推理芯片基於10納米技術

蘋果Siri前主管Bill Stasior加入微軟,擔任技術副總裁一職

BenevolentAI:與Neuropore合作,通過AI發現新型治療藥物

標籤:

IBM智能設備

歡迎關注ATYUN官方公衆號

商務合作及內容投稿請聯繫郵箱:[email protected]

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章