英特爾推出新一代Neural Compute Stick驅動器,機器學習計算性能提升8倍

編譯:chux

出品:ATYUN訂閱號

自英特爾公司推出Movidius Neural Compute Stick以來,已經有一年多的時間了。這一售價79美元的拇指大小的驅動器,裝有專爲加速機器學習算法而設計的系統芯片,是英特爾於2016年9月收購的芯片製造商Movidius的產品。在此期間,數千名開發人員使用它,並在數十個研究項目中亮相。

本週在北京舉行的英特爾首屆AI開發者大會上,英特爾展示了Neural Compute Stick 2(NCS 2)。它拋棄了其前身的Myriad 2視覺處理單元(VPU),推出更強大的Myriad X VPU,英特爾聲稱它的總體計算性能是以前的8倍。在中國可以通過京東商城買到,價格爲99美元。

英特爾將NCS 2作爲原型AI算法的全棧解決方案,比如卷積神經網絡(CNNs),它構成了許多圖像識別系統的主幹。英特爾物聯網集團副總裁兼總經理Jonathan Ballon表示,它實際上是爲測試智能相機、無人機、工業機器人和智能家居設備量身定製的。

Ballon指出,“在過去四年左右的時間裏,AI已經在雲端或數據中心中大量應用,如果你有大量的數據,並且你有無限的計算資源,以及電力和冷卻系統,這是很好的。但在數據中心之外,功耗非常重要,熱量和成本也是如此。利用NCS 2可以讓客戶很容易地拋開這些約束條件。”

Myriad X

NCS 2支持USB 3.0 / 3.1,這是對原始NCS USB 2.0的改進。它可以使用額外的NCS 2進行線性擴展。

引人注目的是,前面提到的Myriad X VPU,基於16納米FinFET工藝,而不是Myriad 2的28納米,擁有16個128位流混合架構矢量引擎(SHAVE)處理器內核(Myriad 2爲12個),以及擴展的2.5MB芯片存儲器和兩個通用RISC內核。它包含新的低功耗視覺加速器,包括一個可以處理高達180Hz的雙720p饋電的立體聲模塊,以及一個可調諧的集成信號處理器管道,採用基於硬件的編碼,可在8個傳感器上實現高達4K的視頻分辨率。

值得注意的是,Myriad X是第一款採用英特爾神經計算引擎的VPU,這是一種專用硬件加速器,支持原生FP16和定點8位支持。

英特爾聲稱該芯片組的專用神經網絡計算,可以達到每秒4萬億次的計算速度和每秒1萬億次運行,是深度神經網絡推理中Myriad 2性能的10倍左右。

“它真正面向數據科學家或應用程序開發人員,他們希望根據各種功能限制從各種異構架構中獲得最大性能,”Ballon說。

商業化AI

開發人員使用Movidius Compute Stick來製造各種設備,從鯊魚識別無人機到低成本的皮膚癌篩查相機,而英特爾希望這次也能達到同樣的效果

除了英特爾的計算機視覺SDK和Movidius計算SDK之外,NCS 2還支持OpenVINO(開放視覺推理和神經網絡優化),這是一個用於AI邊緣計算的工具包,它與Facebook的Caffe2和谷歌的TensorFlow等框架兼容,併爲物體檢測,面部識別和物體跟蹤附帶預訓練的AI模型。

Ballon解釋說,英特爾推出的營銷力量主要體現在其去年推出的英特爾AI:In Production計劃中,推出了NCS 2,它本質上是一個將AI原型推向市場的端到端平臺。

他說:“我們希望超越學術試驗和概念驗證的範疇,幫助開發者生態系統的創新實現商業化。”

爲此,開發人員可以通過可定製配置訪問具有存儲空間的英特爾AI DevCloud集羣,以及可定製的英特爾Xeon Scalable處理器。一旦進行遠程測試,優化和驗證了模型,就會提供工具包和代碼示例,使其更容易針對硬件進行開發,例如Aaeon Technologies等製造商提供的NCS 2或mini-PCIe開發板。

“這是我們硬件的單一平臺,它彙集了軟件工具,訓練,專家和生態系統,並幫助開發人員找到合適的合作伙伴,無論他們是ISP還是雲服務提供商,甚至是設備製造商,”Ballon說。

英特爾公司副總裁兼AI產品集團總經理Naveen Rao表示,“第一代NCS激發了整個AI開發人員社區的行動,我們很高興看到社區通過英特爾NCS 2強大的計算能力增強創造力。”

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章