AI一週熱聞: 微軟拒絕出售人臉識別產品;波士頓動力機器人SpotMini即將商用

  • 波士頓動力機器人SpotMini拉貨車,即將商用
  • 蘋果與高通意外和解,英特爾退出 5G 調制解調器業務
  • 斯坦福大學用居民住宅照片預測個人出車禍的風險
    -  香港科技大學研發路面分析無人機系統
  • 用iWildCam30萬張圖像數據集訓練AI觀察研究野生動物
  • 強化學習先驅Max Welling:計算很重要,數據同樣非常重要
  • 莫勒圖沃大學用膠囊網絡通過少量數據教會機器識別手寫字符
  • GLUE難度太低,紐約大學創建新基準SUperGLUE
  • 考慮到人權問題,微軟公司拒絕出售人臉識別產品

波士頓動力機器人SpotMini拉貨車,即將商用

近日,波士頓動力發佈一段視頻,視頻中十隻四足機器人SpotMini拉着一輛貨車前進,展示了SpotMini的另一項技能。

據波士頓動力透露,SpotMini即將投入商用,但未公佈價格。此前早就有SpotMini將商用的消息傳出,表示波士頓動力計劃到2019年7月,每年量產1000臺SpotMini機器狗,聚焦建築、送貨、安全和家庭助理領域。

蘋果與高通意外和解,英特爾退出 5G 調制解調器業務

近日,蘋果與高通宣佈結束爲期兩年的專利許可爭奪戰,並已經在全球範圍內達成和解,這意味着美國外,中國、德國和其他國家的訴訟全面終止。根據聯合聲明,蘋果將向高通支付一筆未明確數字的款項,雙方還達成了一項爲期六年的全球專利許可協議,包括兩年的延期選項權和多年芯片組供應協議,該協議於 2019 年 4 月 1 日生效。

隨後,英特爾宣佈退出 5G 調制解調器業務,並完成對 PC、物聯網設備和其他以數據爲中心的設備中 4G 和 5G 調制解調器機會的評估。英特爾還將繼續投資其 5G 網絡基礎設施業務。該公司將繼續滿足其現有 4G 智能手機調制解調器產品線的客戶承諾,但不希望在智能手機領域推出 5G 調制解調器產品,包括最初計劃於 2020 年推出的產品。

斯坦福大學用居民住宅照片預測個人出車禍的風險

…儘管數據類型有所不同,但其之間所存在着令人驚訝的對應關係…

來自華沙大學與斯坦福大學的研究人員們展示瞭如何利用居民住宅的照片更好地預測對應個體發生車禍的可能性。(作者注:這裏所提到的「相關性」並不代表二者之間存在因果關係。)

在這個項目中,研究人員分析來自保險公司客戶的2萬個家庭住址,具體數據源自2012年1月至2015年12月由波蘭各保險公司收集到的隨機樣本。對於每一個地址,研究人員們分別收集了谷歌衛星視圖與谷歌街景圖像。以此爲基礎,他們採用房產類型、年齡、條件、居民財富估算值等作爲標籤,同時結合周邊建築物的類型與密度對圖像內容進行標註。最後,他們對這些變量進行測試,並發現全部七種變量中的五種在保險預估問題中具有重要意義。

研究人員寫道,“儘管數據的波動性很大,但在我們將五個簡單變量添加到保險公司的模型當中之後,發現其在20次重新取樣試驗中實現了高達90%的效能改善比例,並在基尼係數計算中實現近2%的平均預測準確率。”

最終,研究人員得出結論——“房屋圖片中的可見特徵能夠有效用於車禍風險預測,且這些特徵獨立於傳統常用的各類變量,例如年齡或郵政編碼等。”更重要的是,這一論斷具有強力的統計結果支持。

重要意義:此類研究再次證明了大規模數據分析的力量,讓我們意識到在對大量數據進行比較與比對時,某些獨立來看無關緊要的數據也有可能擁有重大意義。研究人員們另外指出,“現代數據收集與計算技術,使我們能夠以前所未有的方式對個人數據加以運用,而這有可能超過立法速度並提高隱私層面的風險。”
  
瞭解更多: Google Street View image of a house predicts car accident risk of its resident (Arxiv)

香港科技大學研發路面分析無人機系統

…無人機+英偉達卡+智能算法=自動機器人檢測員…

來自香港科技大學機器人研究所的研究人員們創造出一套無人機原型系統,可用於對路面狀況做出自動分析。在該項目中,研究人員們開發出一種密集型立體視覺算法,可供無人機分析路面條件。利用這項算法,無人機收集到的道路圖像將得到實時處理,同時自動識別出路面的差異性狀況。

相關硬件: 爲了完成這一目標,研究人員們在一臺大疆Matrice 100無人機上安裝了ZED立體攝像頭,併爲無人機本體安裝了JETSON TX2 GPU以進行實時數據處理。

重要意義:AI技術使得機器人能夠自動感知並分析真實世界中的各項指標。此類實驗的出現,代表着我們正在快速邁向通過無人機實現各類監控活動(包括民用與軍用)的自動化新時代。
  
瞭解更多: Real-Time Dense Stereo Embedded in a UAV for Road Inspection (Arxiv)
  Get the datasets used in the experiment here (Rui Fan, HKUST, personal website)

用iWildCam30萬張圖像數據集訓練AI觀察研究野生動物

…深度學習系統開始對我們的蔚藍星球展開監測…

來自加州理工學院的研究人員們發佈了iWildCam數據集,據稱利用這套數據集訓練出的系統,能夠自動分析美國西南部觸發式相機所拍攝到的野生動物。此外,研究人員們還組織了一次基於該數據集的挑戰賽,邀請全球各地的更多愛好者開發出能夠自動監測真實世界的AI系統。

測試概述: 研究人員們寫道,“如果我們希望構建起一套能夠廣泛檢測動物對象並進行分類的系統,並在無需進一步訓練的前提下將其部署至各類新環境中,我們就必須對機器學習與計算機視覺的環境適應能力進行一番深入測試。”

常見難題:從陷阱觸發式相機中收集數據,主要存在六大難題——照明環境多變、運動模糊、焦點區大小(動物本體可能很小且距離相機較遠)、遮擋、僞裝以及透視。

iWildCam:這套數據集中的圖像全部來自安裝在美國西南部的攝像頭,具體爲來自143個地點的總計292732張圖像。iWildCam旨在幫助生物學家理解所需要處理的數據集的複雜程度。研究人員們寫道,“可以看到,各個位置的圖像數量、當地物種分佈以及物種的總體分佈都是不平衡的。”

重要意義:這樣的數據集,外加以其爲基礎構建而成的AI系統,將成爲我們自動觀察並分析周遭世界的有力工具;考慮到日益混亂的自然環境,利用機器資源自動分析環境變化對人類將具有重大的現實意義。
   
瞭解更多: The iWildCam 2018 Challenge Dataset (Arxiv)
 
獲取數據集: iWildCam  2019 challenge (GitHub)

強化學習先驅Max Welling:計算很重要,數據同樣非常重要

…“機器學習中最基本的教訓,就是在偏差-方差間的權衡”…

幾周之前,強化學習領域的先驅之一Richard Sutton撰寫了一篇關於AI研究中“痛苦教訓”的文章,其中提到從業者應當將高計算量、低算法難度作爲一項基本原則。如今,阿姆斯特丹大學的研究員Max Welling在文章中迴應稱,數據的重要意義絲毫不遜於計算。

“機器學習中最基本的教訓,就是在偏差-方差間的權衡:當擁有充足的數據時,我們就不需要在模型之上投入大量人爲干涉以歸納偏差。但是,如果數據不夠充分,那麼就必須得利用人類知識填補這種空白。”

Welling指出,無人駕駛汽車就是一個很好的例子,其再次證明單憑強大的算力並不足以解決全部問題。很明顯,無人駕駛汽車要求我們在模型當中注入更爲強大的先驗信息(例如對真實世界中物理學效應的解釋)。此外,他還建議生成模型以填補其中的某些空白,特別是在與泛化相關的場景當中。

最終,Welling認爲正確的答案應該介於“計算重要論”與“強大先驗論(例如數據)”之間。“在我看來,如果我們希望解決人工通用智能,也就是ASGI的問題,那麼我們真正需要的是基於模型的強化學習。如果不解決數據可用性這一前提,我們根本無法判斷到底是否需要對模型進行人工設計。”

重要意義:AI研究當中天然存在一種對立關係,即到底應該將主要精力放在計算身上,還是放在數據身上。不同的側重傾向,往往帶來完全不同的研究途徑與專業化取向。我很擔心這種趨勢最終引發分裂,即那些選擇進行大量“大計算”的研究者,會與更看重很先驗因素的研究者們徹底失去相互交流的能力。
 
瞭解更多: Do we still need models or just more data and compute? (Max Welling, PDF)

莫勒圖沃大學用膠囊網絡通過少量數據教會機器識別手寫字符

…利用膠囊網絡生成合成數據…

莫勒圖沃大學的研究人員們希望能夠利用極少量數據教會機器如何識別手寫字符。爲了達成目標,他們採用一種被稱爲“膠囊網絡(Capsule Networks)”的方法——這一新興技術受到深度學習先驅Geoff Hinton的大力支持——使得系統得以僅利用200個例子即獲得手寫字母的分類能力。

實現這一目標的主要方式,在於利用膠囊網絡的一些特殊性質實現小型數據集的合成增強。具體來講,研究人員利用“由協議實現的路由”等技術使系統能夠理解數據表示,而這種表示能夠很好地適應系統從未見過的情況。利用這些特徵,研究人員能夠直接操作系統觀察時接收到的各種數據表示,並利用算法生成看起來與訓練數據集類似的手寫字符;最神奇的是,二者又並不完全相同。如此一來,系統即可獲得訓練所必需的大量額外數據,且再不必從(昂貴的)現實環境中採集更多數據。

研究人員們寫道,“通過向表示實體屬性的實例化參數中添加包含受控變量的噪聲,我們得以將實體轉換爲能夠表徵實際對象的變體。這帶來了一種新穎的數據生成技術,且真實性高於仿射變換數據。從基本思路來看,我們提出的這種擾動算法旨在將受控隨機噪聲添加到實例化的矢量值當中,從而創建出與原始圖像截然不同的新圖像,從而有效增加訓練數據集的規模。”

實際效果:爲了尋求答案,研究人員們從EMNIST、MNIST以及視覺效果更爲複雜的Fashion MNIST數據集當中提取200個數據樣本,並在訓練完成後利用系統識別TextCaps完整數據集以測試其具體效果。當使用三種EMNIST變體的全部數據進行訓練時,系統對TextCaps的識別效果最佳;但僅使用200項樣本時,系統的表現同樣趨近於最佳水平。更重要的是,單純使用MINIST與Fashion MNIST的200項樣本訓練時效果仍然非常理想(不過在單獨使用Fashion MNIST時系統的識別能力則相當糟糕,這可能與該數據集的複雜性有關)。

重要意義:這樣的方法表明,當我們開發出越來越複雜的AI系統時,在其中添加一些限制反而有可能使系統獲得更好的現實處理能力——在某些場景下,我們可能既希望使用AI方案,又缺少規模可觀且標記良好的數據集(例如在學習識別及分類多種語言的手寫文字時,某些語言的示例可能相對有限)。研究人員們寫道,“我們打算將這套框架擴展至RGB空間中的圖像上,同時提高樣本分辨率,例如引入來自ImageNet與COC的圖像。此外,我們還打算從字體文件當中提取訓練圖像,從而利用這套框架實現自動語言本地化。”

瞭解更多:

TextCaps: Handwritten Character Recognition with Very Small Datasets (Arxiv)

Understanding Hinton’s Capsule Networks (Medium)

How Capsules Work (Medium)

Understanding Dynamic Routing between Capsules (Capsule Networks explainer on GitHub)

GLUE難度太低,紐約大學創建新基準SUperGLUE

…拜拜了,GLUE——你的難度太低啦!…

由於某些類型的語言建模進展快於預期,紐約大學的研究人員不得不拋棄他們去年開發的基準,轉而通過新基準提高考覈難度。這套新的“SuperGLUE”基準正是GLUE的繼承者,旨在提供難度高於GLUE的更多任務。

更多新任務挑戰你的系統:SuperGLUE中的任務包括:CommitmentBank,其目標是要求系統判斷作者對於句子當中特定子句的肯定程度;合理替代項選擇(簡稱COPA),要求系統在兩種場景下選擇可能性更高的句子;性別模糊代詞共指任務(簡稱GAP),系統需要“確定模糊代詞的準確指示物”;多句閱讀理解數據集,一套是否問題判斷題集;RTE,GLUE 1.0中已經具有的文本補全任務;WIC,要求系統消除歧義;Winograd Schema Challenge,一項閱讀理解任務,專門測試系統是否具有某些基本常識(例如是否認爲可以將大物體裝進小物體當中,反之亦然)。

PyTorch工具包:研究人員們還計劃發佈基於PyTorch與AllenNLP軟件的工具包,其中包括OpenAI GPT以及谷歌BERT等預訓練模型,可用於實現快速實驗與原型設計。與GLUE一樣,新版本同樣提供可供人們參與競爭的在線排行榜。

重要意義:精心設計的基準測試,無疑是我們用於判斷AI進展的最佳工具之一。因此當AI的發展進度超越基準測試時,就代表着這一領域的前進腳步相當迅猛。研究人員們認爲SuperGLUE的難度可以讓人滿意,至少還能夠難住AI系統一段時間。他們還提議,“SuperGLUE中包含一系列難度較高的NLP任務,請拿出具有新鮮創意的方法將其攻克。”

瞭解更多:

Introducing SuperGLUE: A New Hope Against Muppetkind (Medium)

SuperGLUE: A Stickier Benchmark for General-Purpose Language Understanding Systems (PDF)

考慮到人權問題,微軟公司拒絕出售人臉識別產品

在最近於斯坦福大學進行的一次演講中,微軟公司CEO Brad Smith提到微軟方面最近因道德考量而拒絕了一筆交易。他透露稱,微軟公司拒絕向加州執法機構提供人臉識別技術。總結來講,微軟認爲這套方案的交付將給婦女與少數族裔帶來不公正的影響。由於擔心相關方案被用於破壞集會自由,微軟公司亦拒絕了某外國政府在其首都安裝人臉識別系統的要求。

瞭解更多: Microsoft turned down facial-recognition sales on human rights concerns (Reuters)

作者 Jack Clark 有話對 AI 前線讀者說:我們對中國的無人機研究非常感興趣,如果你想要在我們的週報裏看到更多有趣的內容,請發送郵件至:jack@jack-clark.net

原文鏈接:
https://jack-clark.net/2019/04/22/import-ai-143-predicting-car-accident-risks-by-looking-at-the-houses-people-live-in-why-data-matters-as-much-as-compute-and-using-capsule-networks-to-generate-synthetic-data/

更多內容,請關注AI前線。
image

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章