IBM爲機器學習開發低功耗，高性能的視覺系統

原創

2020-07-02 22:05

內容來源：ATYUN AI平臺

機器學習算法近年來有了突飛猛進的發展。例如，像Facebook這樣的最先進的系統可以在一小時內訓練圖像分類算法，而不會犧牲準確性。但其中許多人都接受過使用強大GPU的高端機器的訓練，隨着物聯網（IoT）產業向邊緣計算髮展，對低功耗低成本人工智能模型的需求不斷增長。

IBM有前景的研究爲更高效的算法奠定了基礎。在CVPR會議上，該公司的研究人員發表兩篇論文，分別介紹圖像分類處理。

BlockDrop

第一個標題爲“BlockDrop: Dynamic Interference Paths in Residual Networks”，建立在微軟在2015年發佈的有關Residual networks的工作基礎上。Residual networks（簡稱ResNets）引入了神經網絡中各層之間的身份連接，允許它們在訓練過程中學習增量或殘餘。

IBM將這一想法向前推進了一步。科學家們引入了一個輕量級的二級神經網絡，在本文中稱爲“策略網絡”，在預先訓練的ResNet中動態地丟棄殘餘塊。爲了確保性能收益不以精確爲代價，策略網絡使用最少數量的塊訓練並保持識別準確性。

IBM研究經理Rogerio Feris表示，“一般來說，如果向模型添加更多圖層，可以提高其準確性，但是會增加計算成本，目前大多數模型的一個問題是，有一個通用的網絡，在所有圖像中都使用相同的計算。我們的系統可以更有效地分配資源，並準確地識別圖像。”

BlockDrop將圖像分類平均加快了20％，在某些情況下加快了36％，同時保持了76.4％的準確性。

論文網址：arxiv.org/abs/1711.08393

改善立體視覺

第二篇論文“A Low Power, High Throughput, Full Event-Based Stereo System”解決了圖像處理中的另一個問題：立體視覺。

正如IBM研究員Alexander Andreopoulos解釋的那樣，人類的眼睛相距幾釐米，從略微不同的角度看世界。大腦的視覺皮層將兩隻眼睛的圖像無縫融合爲一體，使我們能夠感知深度，但雙攝像機器人系統在協調視差方面更困難。

“在計算機視覺的情況下，相機鏡頭有異常，這會導致噪音並使問題複雜化，”Andreopoulos說。

研究人員的解決方案是：運行在IBM TrueNorth神經形態芯片上的系統，該系統具有針對機器學習模型進行了優化的高度並行化架構。系統使用九個處理器的集羣，一對基於事件的攝像頭（當它們檢測到運動時只拍攝圖像的攝像頭）以及一臺將計算分配給上述芯片的筆記本電腦，每秒算法捕獲並處理400（最多達2,000）視差圖。

Andreopoulos解釋說，基於事件的攝像機的使用大大減少了帶寬和能源消耗。“立體聲算法已經存在了30多年，但大多數系統都採用積極的方法來感知世界。我們使用的方法很被動。”

總體而言，與具有高幀速率照相機的最先進系統相比，該系統在每個像素的每像素功率方面的性能提高了200倍。

這些結果爲依靠低功耗，低延遲深度信息來導航世界的機器人系統帶來希望。

論文網址：researcher.watson.ibm.com/researcher/files/us-aandreo/cvpr2018.pdf

本文轉自ATYUN人工智能媒體平臺，原文鏈接：IBM爲機器學習開發低功耗，高性能的視覺系統

更多推薦

英特爾推出其Nervana推理和訓練芯片，首款AI推理芯片基於10納米技術

蘋果Siri前主管Bill Stasior加入微軟，擔任技術副總裁一職

BenevolentAI：與Neuropore合作，通過AI發現新型治療藥物

標籤：

IBM 智能設備

歡迎關注ATYUN官方公衆號

商務合作及內容投稿請聯繫郵箱:[email protected]

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

IBM爲機器學習開發低功耗，高性能的視覺系統

BlockDrop

改善立體視覺

10分鐘搞定Mysql主從部署配置

如何使用 JS 判斷用戶是否處於活躍狀態

「Pygors跨平臺GUI」2：安裝MinGW-w64、MSYS2還是WSL2

[轉帖]

python列出centos7內存使用前50的進程信息

「Pygors跨平臺GUI」1：Pygors跨平臺GUI應用研究

一鍵自動化博客發佈工具,用過的人都說好(掘金篇)

lightdb數據庫超時相關控制參數

lightdb秒級增加列和刪除列（not null帶默認值）

Java ThreadPoolShutdown

上輩子是運動員？一款人臉識別AI應用檢測你與哪個世界盃運動員長得最像

AMAX推出AI訓練和推理平臺DL-E48A，支持超大規模部署

Salesforce開發設計了一個可以處理大量不同NLP任務的通用模型

NVIDIA發佈最新數據增強庫和圖像解碼庫

斯坦福大學研究人員利用AI生成表情包

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結