AI一週熱聞:史上最強AI補代碼工具Deep TabNine;英特爾發佈神經形態芯片,效率達CPU一萬倍

  • 中國公司賽格威製作數據集DRIVE,助力智能貨運機器人研發
  • 印度開發野生靈長類面部識別系統,人類有望在未來協作量化周圍世界
  • Recursion發佈RxRx1數據集,助力新葯物開發
  • 紐約大學推出用於AutoML模型構建和管理的交互式系統Visus
  • 史上最強AI補代碼工具Deep TabNine
  • AI攻克六人無限制德州撲克遊戲
  • 研究人員提出多線性模型,可壓縮模型參數、提升模型表現
  • 英特爾發佈Pohoiki Beach系統,搭載神經形態芯片Loihi
  • CVPR新研究:光流引導可填充視頻缺失區域

中國公司賽格威製作數據集DRIVE,助力智能貨運機器人研發

image

中國機器人公司賽格威的研究人員正在製作一個名爲“DRIVE” 的數據集和基準,旨在幫助研究人員研發更智能的貨運機器人。

賽格威製作“DRIVE” 數據集的目的是鼓勵相關業務領域的研究,同時也是基於宏觀經濟趨勢的考慮:“中國的線上購物和外賣配送市場每年以30%-50%的速度增長,引發了勞動力短缺及送貨成本上升的問題,” 研究人員寫道。貨運機器人有可能解決這個由消費需求上漲及送貨勞動力短缺造成的困境。

每個用來收集數據集的賽格威機器人都配備一個RealSense慣性傳感器,兩個車輪編碼器以及一個Hokuyuo 2D 激光雷達。

DIRVE 數據集:該數據集包括100個移動鏡頭,收錄內容涵蓋五個不同的室內場地,由機器人在一年的時間內收集,它的設計相當具有挑戰性,包括以下綜合因素和特性:

  • 成本低,安裝有慣性測量單元

  • 場景繁忙:在收集的數據包括的場景中,有許多移動的人和物,這會破壞脆弱的AI系統。

  • 相似性:一些環境相互之間十分相似,這可能引發分類錯誤。另外,環境中的一些地點缺少紋理或包括大量的反射光和陰影,使得機器人難以從視覺上分析它們的環境;還有一些環境的表面崎嶇不平或比較粗糙。

慢還是快:在一些數據集包含的長鏡頭中,機器人是靜止的,這使得它難以估計深度。同時,在其它時候機器人也會快速轉動,這會帶來運動模糊及車輪在地面打滑的問題。

爲什麼這很重要:數據集解鎖AI發展,讓多人一起協作解決挑戰。另外,數據集一般會暗示着商業及研究的優先項,因此DRIVE Benchmark的出現暗示了智能移動機器人正逐漸成熟。

閱讀更多:

https://arxiv.org/abs/1907.03424

http://drive.segwayrobotics.com/#/

印度開發野生靈長類面部識別系統

印度德里Indraprastha信息技術研究所和印度野生動物研究所的研究人員合作開發了一種能夠識別野生猴子的系統,並將其關聯到一個衆包應用上,讓“普通大衆、專業的猴子捕捉者及野外生物學家“能夠提供猴子的源圖像,用來訓練更大、更智能的模型。

爲什麼這樣做? 研究人員寫道,在印度的城市和半城市化地區猴子都有點令人討厭,因此他們設計了這個系統,利用“在野外”獲取的的數據,幫助人們建立系統來監視和分析生存在具有挑戰性的環境中的靈長類動物。 “ 我們希望捕捉到猴子在不受控制的室外場景中的圖像,這種環境下面部姿態和光線會出現明顯變化”。

數據集

恆河猴數據集:7679張圖片/ 93個猴子。

黑猩猩數據集:7166張圖片/ 90個靈長類動物。在所有的圖片中,來自動物園的圖片質量較高,而來自國家公園的圖片質量不可控。

結果

該系統優於各種基本標準,並在四個驗證分數中表現出了最優性能,通常情況下性能表現增加至少2個點,有時多達6個及以上。經過一系列不同的損失函數訓練,系統會捕捉較小的面部幾何特徵,從而增強模型在多個數據分佈中的魯棒性。

爲什麼它很重要:這項研究顯示了隨着人工智能逐漸成熟,我們開始看到它被用作一種通用的實用工具,研究人員混合和匹配不同的技術和數據集,進行輕微的調整,併爲社會相關的應用處理任務。有趣的是,這種方法與衆包應用程序集成的方式讓我們看到未來的方向,即人們能夠協作測量、分析和量化周圍的世界。

閱讀更多:野生靈長類面部識別(Arxiv)

https://arxiv.org/abs/1907.02642

Recursion發佈RxRx1數據集,助力新葯物開發

Recursion Pharmaceuticals是一家利用AI進行藥物開發的公司,它發佈了一個名爲 “RxRx1”的296GB的數據集,其中包含1108個類別的125510個圖像。RxRx1是一個ImageNet規模的數據集,它包含了人體細胞的圖片,幫助科學家訓練AI系統以觀察它們的模式,進而從中獲得發現促進新葯物的開發工作。

生物學的挑戰:由於細胞樣本之間的差異以及數據採樣過程中存在的其他因素(如溫度、溼度、試劑濃度等),生物數據集可能會對圖像識別算法帶來挑戰。 RxRx1包含來自同一實驗的51個實例數據,有助於科學家開發對實驗中的變化具有魯棒性的算法,從而學習數據中的基礎模式。

RxRx1可以在哪些方面助力人工智能研究?Recursion的想法如下:

  • 泛化:數據集有利於改進轉移學習和領域適應等技術。

  • 背景建模:每個RxRx1圖像都附帶詳細的元數據,因此研究人員可以將其作爲一種額外的信號形式進行實驗。

  • 計算機視覺:RxRx1“的數據分佈與大多數公開可用的成像數據集中的數據分佈非常不同,”Recursion寫道。 “這些差異包括:許多頻道的相對獨立(這點與RGB圖像不同),以及每個例子都作爲多個對象中的一個以類似的方式被對待。”

爲什麼它很重要:我們正進入的是一個人們將開始利用大規模機器學習來徹底改變醫學的時代;跟蹤RxRx1等數據集的使用情況以及NeurIPS 2019競賽結果將有助於我們瞭解該領域的進展以及它對醫學和藥物設計的意義。

閱讀更多:RxRx1官方網站(RxRx.ai

https://www.rxrx.ai/

紐約大學推出用於AutoML模型構建和管理的交互式系統Visus

紐約大學的研究人員開發了Visus軟件,該軟件使人們構建、改進模型以及管理模型訓練的相關數據處理管道更加容易。作爲一種工具,它體現了人工智能社區工業化愈加廣泛,並預示了機器學習在社會中的更大用途。

什麼是Visus?該軟件爲AI開發人員提供了一個軟件界面,可以讓他們定義問題、研究輸入數據集的摘要、增加數據,然後根據它們的性能得分和預測結果來探索和比較不同的模型。該軟件的用戶界面設計精美,這使得它比只能通過命令行訪問的工具更易於使用。

它能做什麼?不能做什麼? Visus是“kitchen sink軟件“,這是因爲針對探索性數據分析、問題說明、數據增強、模型生成和選擇,以及驗證數據分析等任務,它包含大量的功能。

用例:研究人員舉了一個例子,假設紐約市交通部用Visus來制定可以減少交通事故死亡率的政策。他們首先使用Visus來分析有關交通碰撞事故的數據集,然後在數據集中選擇一個他們想要預測的變量(例如,碰撞事故的數量),然後讓Visus進行模型搜索(要不然它就會被稱爲’AutoML’了),這時Visus就會試圖找到適當的機器學習模型來實現目標。它提出模型後,用戶還可以嘗試擴充基礎數據集,然後再次迭代模型設計和選擇。

爲什麼它很重要:像Visus這樣的系統是人工智能產業化的一部分,因爲他們做了一系列令人難以置信的複雜事項(如數據增強和模型設計與分析),然後將其移植到對用戶友好的軟件包中,從而使得能使用這樣系統的人增多。這就像從手工個性化生產轉向基於系統的可重複生產。Visus之類工具的採用將使社會中更多的人使用人工智能系統,從而進一步改變社會。

閱讀更多:Visus:自動機器學習模型構建和管理的交互式系統(Arxiv)

https://arxiv.org/abs/1907.02889

史上最強AI補代碼工具Deep TabNine

加拿大一名大四學生Jacob Jackson開發了一款名爲“Deep TabNine”的自動代碼補全工具,旨在幫助開發者提高編碼速度。目前Deep TabNine可支持Java、Python、C++及Haskell等多種編程語言。
 
Deep TabNine 的開發者利用GitHub 上約200萬個文件對它進行了訓練,用前面的token來預測下一個token。爲了實現代碼補全功能,Deep TabNine學習了動態類型語言中類型推斷等複雜行爲。甚至是一些細微的線索TabNine也可以利用起來,比如假設app.get_user()的返回類型是一個帶setter方法的對象,但app.get_users()的返回類型卻是一個列表:
 
image

Deep TabNine基於GPT-2構建,使用的是Transformer網絡架構。這個架構最初被開發出來是爲了解決自然語言處理領域存在的問題,儘管構建代碼模型和構建自然語言模型看起來毫不相干,但構建代碼模型是需要以一些意想不到的方式理解英語的。比如利用if/else語句讓模型否定單詞:

image

這個模型還能利用自然語言寫的文檔來推斷函數名稱、參數和返回類型:

image

此外TabNine還應許多用戶的要求加入了先前就存在的知識,例如當一個類擴展 React.Component 時,它的構造函數通常會採用一個名爲props的參數,且用this.state進行賦值。

image

Deep TabNine甚至可以記住C++可變轉發句法:

image

Deep TabNine需要大量算力,用戶在筆記本電腦上運行這個模型則無法獲得低延遲體驗,因此開發者推出了TabNine Cloud服務方便用戶使用。

閱讀更多:https://tabnine.com/blog/deep

AI攻克六人無限制德州撲克遊戲

Facebook 與卡耐基梅隆大學(CMU)共同研發的Pluribus在六人無限制撲克遊戲中打敗了多名精英玩家。比賽採用兩種模式:“5個AI+1名人類玩家”和“1個AI+5名人類玩家”。這是AI首次證明它有能力在多人遊戲中戰勝頂級專業人士。

Pluribus是基於 Libratus以及卡梅隆大學Tuomas Sandholm實驗室的其它算法和代碼改進而來, Libratus曾於2017年在兩人無限制撲克遊戲中戰勝了人類專業玩家。值得一提的是,Pluribus整合了一種新的在線搜索算法,通過提前搜索一些動作可以幫助AI有效評估自己的選擇。它還利用了新的self-play算法來應對遊戲中存在的隱藏信息。這些提升使得Pluribus的訓練只消耗了很少的處理能力和內存,與之相比,一些AI里程碑式的項目動不動就要耗費耗費價值幾百萬美元的計算資源。

閱讀更多:

https://science.sciencemag.org/content/early/2019/07/10/science.aay2400

研究人員提出多線性模型,可壓縮模型參數、提升模型表現

神經模型的最新進展將編碼器和解碼器通過自注意力機制聯繫起來。Transformer就是一種完全基於自注意力機制的架構,它的出現爲自然語言處理任務的解決帶來了突破性進展。然而,Transformer的重要組成部分——多頭線性注意力機制卻限制了神經模型的有效部署。

爲了解決這個問題,天津大學和微軟亞洲研究院的研究人員根據張量分解和參數分享的理念提出了一個帶Block-Term Tensor Decomposition (BTD)的自注意力模型(也就是多線性模型)。研究人員對三個語言建模任務和一個神經機器翻譯任務進行了測試,證實多線性注意力不但可以大大壓縮模型參數,還能提升模型表現。

閱讀更多:

https://arxiv.org/pdf/1906.09777.pdf

英特爾發佈Pohoiki Beach系統,搭載神經形態芯片Loihi

image

在美國國防部高級研究計劃局(DARPA)2019 電子復興峯會上,英特爾實驗室總監 Rich Uhlig 公佈了一個名爲“Pohoiki Beach”的系統,這是一個64芯片計算機,能夠模仿800萬個神經元。 Uhlig稱英特爾將向60個合作伙伴提供該系統,以促進該領域發展,並升級冗餘編碼和路徑規劃等AI 算法。

Pohoiki Beach搭載了64個128核、14納米的神經形態研究芯片Loihi。據稱Loihi處理信息的速度比傳統處理器快1000倍,效率高1000倍。

閱讀更多:https://venturebeat.com/2019/07/15/intels-pohoiki-beach-is-a-neuromorphic-computer-capable-of-simulating-8-million-neurons/

CVPR新研究:光流引導可填充視頻缺失區域

CVPR最近刊登了一項由商湯港中大聯合實驗室和商湯南洋理工聯合實驗室的研究,提出了一個名爲“光流引導” (Flow-Guided) 的視頻修復算法。

研究人員首先使用新設計的Deep Flow Completion網絡在視頻幀上合成了一個空間和時間上相干的光流場,然後用它來引導像素的傳播,以填充視頻中的缺失區域。該光流引導可以幫助精確地填充缺失的視頻區域。研究人員將這種方法在DAVIS和YouTube-VOS數據集上進行了定性和定量評估,結果顯示,無論是在質量還是速度上,填充性能都非常優越。

閱讀更多:https://arxiv.org/abs/1905.02884

作者 Jack Clark 有話對 AI 前線讀者說:我們對中國的無人機研究非常感興趣,如果你想要在我們的週報裏看到更多有趣的內容,請發送郵件至:[email protected]

參考鏈接:

https://jack-clark.net/2019/07/15/import-ai-155-mastering-robots-with-the-drive-dataset-facial-recognition-for-monkeys-and-why-ai-development-is-a-collective-action-problem/

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章