本週AI熱點回顧:Facebook競賽50萬美元冠軍成績被莫名取消、哈工大、哈工程被禁用「工科神器」MATLAB...

01

50萬美元冠軍成績被莫名取消,Facebook熱門數據競賽引爭議

本屆 Deepfake 比賽,主辦方 Facebook 開出了共計百萬美元的獎金,其中頭名團隊可以獲得 50 萬美元。在這項賽事中,數據科學家們需要通過算法檢測出使用 Deepfake 技術換臉的「虛假圖像」,幫助阻止惡意篡改的圖片誤導他人。豐厚的獎金,熱門的研究領域讓 DFDC 在去年 9 月宣佈以來受到了業內的廣泛關注。這項比賽在去年 12 月的 NeurIPS 2019 大會上公佈了數據集並正式開始,今年 3 月 31 日結果提交正式截止。據統計,這一在著名數據競賽平臺 Kaggle 上進行的比賽吸引了 2114 名參與者,並獲得了 3.5 萬種檢測算法,最終得出的最高準確率達 82.56%,整體平均準確度爲 65.18%。

在這場比賽中,原本排名第一的團隊因爲數據的原因,優勢方案被取消成績,最終他們的第二方案獲得了第七名。該團隊的成員表示,在過去兩個月中,這一團隊與 Facebook 進行了多輪接觸,但沒有獲得令兩方信服的結果。

沒有觸犯任何規則卻被取消了成績,還要求參賽隊伍提交額外數據集裏出現人物每個人肖像的授權許可,facebook 這樣「魔性」的要求讓參賽隊伍在過去兩個月的交涉過程中身心俱疲。這一事件爆出後立即引發了社區的大量討論,Facebook 對於頭名團隊的奇怪要求成爲了主要槽點:

英偉達資深系統軟件工程師,Kaggle Grandmaster 獲得者 Bojan Tunguz 對此表示:「幾乎所有計算機視覺研究都依賴於預先訓練的模型,這些模型顯然已經在有人類照片的數據集上進行了訓練。如果我們需要所有這些人的明確同意才能進行研究,那麼就不會有什麼開放科學。」

根據 Kaggle 條款,除非法律禁止,否則你與任何競賽實體因爲數據競賽產生的糾紛,任何獎項的確定都不得訴諸於任何形式的集體訴訟。因此這一爭議目前看來無法通過法律途徑來解決了。

信息來源:機器之心

02

哈工大、哈工程被禁用「工科神器」MATLAB,美國「實體名單」影響深入校園

哈工大、哈工程的老師和學生們最近無法使用 MATLAB 了,這一消息迅速成爲了人們關注的熱點。近日,在知乎等社交網絡上,有哈工大學生表示收到了正版軟件取消激活的通知,而在與 MATLAB 開發公司 MathWorks 交涉之後,人們得知因爲美國政府實體名單的原因,相關授權已被中止。

哈工大學生使用正版 MATLAB 近幾天遭遇的情況:6 月 6 號人們在使用 MATLAB 時突然跳出反激活通知,此時點擊反激活還能使用。但到了 6 月 7 號啓動 MATLAB 時又顯示授權許可無效,網頁無法登錄哈工大域名的賬戶,重置密碼後郵件顯示:

這是一件令人無語的事。該學生表示,作爲已付費的正版軟件,未來也許還有希望有限使用。但 MATLAB 被封禁也可能只是一個開始,更多來自美國的軟件可能都會碰到這種情況。

哈工大、哈工程最近的遭遇,和去年華爲被美國列入「實體名單」時有些相似。由於美國的制裁措施,自去年 5 月至今華爲手機一直不能使用谷歌服務框架等一系列軟件服務。如果觀察美國商務部 5 月 22 日公佈的「實體名單」,會發現目前已包含 13 所中國大學:北京航空航天大學、中國人民大學、國防科技大學、湖南大學、哈爾濱工業大學、哈爾濱工程大學、西北工業大學、西安交通大學、電子科技大學、四川大學、同濟大學、廣東工業大學以及南昌大學。

縱觀這些高校,其優勢學科覆蓋範圍很廣,實力也非常強大,涉及航空航天技術、材料、儀器、計算機、工程、人工智能等多個領域。如果阻止這些高校與美國的學術交流,甚至正常教學活動,是對中國高科技發展的一種限制。

對於現在的工科生來說,MATLAB 是必不可少的工具,其必要性可能僅次於 Office 了。如果 MATLAB 官方對哈工大、哈工程持續施行禁用,那麼凡是這些學校發表的論文,其中就不能出現利用 MATLAB 得到的數據、圖、表等——無論你使用的是正版還是盜版。

在社交網絡上,有 Mathworks 員工表示:這次哈工大被禁是因爲美國商務部出臺的實體名單,Mathworks 作爲有軍工應用產品的美國公司只能遵守法規,這並不是 MathWorks 的主動行爲。所謂被禁也只是不能提供技術支持和未來的商務合作,之前賣出去的正版授權應該還是可以用的。

該員工還表示 MathWorks 的立場一直是非常反對貿易戰的,公司高層在季度大會上明確表示過對華爲的禁運會損害人類的科技發展與合作。但是畢竟作爲美國公司,Mathworks 也只能被迫執行禁令。

信息來源:機器之心

03

飛槳核心框架最新升級:靈活高效兼顧,動靜自然統一

在近期舉辦的“WAVE SUMMIT 2020”深度學習開發者峯會上,百度飛槳總架構師於佃海提到:“飛槳的迭代前進,離不開兩個重要驅動輪:一個是產業實踐的打磨,一個是用戶體驗的持續優化。兩個驅動輪互相配合,給飛槳提供了持久、廣泛的發展動力,驅動飛槳擁有一個最靈活易用產業級深度學習框架。”

這兩個驅動,對應到框架的設計,就是在確保高效的同時,做到靈活易用。基於這一指導思想,飛槳在編程界面上同時支持了命令式編程和聲明式編程,即通常說的動態圖和靜態圖。

如何兼顧這兩種模式的優勢,做到靈活編程、高效訓練和部署,同時具備更統一的編程體驗,是一個很大的挑戰。最新發布的飛槳核心框架1.8版本,帶來了重磅更新,總結下來包括兩點:

1、動態圖性能更卓越,經過多個版本的持續深度優化,飛槳動態圖的訓練性能已經媲美靜態圖。

2、動靜更加統一,完備實現了一鍵式動轉靜、動靜混合編程,使動態圖開發可以無縫銜接部署,並能通過靜態圖執行模式對部分模型實現進一步的訓練加速。

飛槳框架的設計思想,是期望將深度學習計算的編程和內在表示保持一致,所以從用戶界面上沒有引入Graph等概念,直接以程序化的“Program”形式描述神經網絡模型的計算過程,對應的用戶開發和通用的編程體驗更加接近。

其實對飛槳而言,基於編程一致的計算描述,向動態圖的擴展,以及動靜轉換都是非常自然的。

其實,對於大部分任務而言,無需通過動靜轉換,飛槳的動態圖訓練已經具備非常高的性能。飛槳自1.3版本版增加動態圖功能以來,持續數個版本,一直致力於提升訓練的整體性能。目前在主流的任務上,飛槳動態圖執行模式已經能夠達到與靜態圖媲美的水平。

以上數據對比了幾個主流模型在單張NVIDIA V100 GPU配置上的訓練數據,測試環境如下:

  • Ernie:基於Wikipedia數據集,配置batch_size 50, seqlen256;

  • Resnet50:基於imagenet數據集,配置 batch_size 128;

  • Transformer base:基於iwslt14 de-en數據集,配置max_token = 4096;

  • Mobilenetv2:基於imagenet數據集,配置batch_size 256。

可以看出同模型在動態圖模式下的訓練速度與靜態圖相當。

信息來源:飛槳PaddlePaddle

04

從無聲的畫面讀出聲音 AI 學會了「讀脣術」

近日,一個印度的技術團隊發佈了在 AI“讀脣術”領域的最新成果。研究人員從數據驅動學習的維度去探討一個問題:“如何從一個人的脣部動作來準確地推斷 ta 的個人語言風格和內容?”

要想由脣部動作生成語音,必須一些無法忽視的阻礙,比如很多聽覺上完全不同的聲音,在脣部動作上是十分相似甚至完全一樣的。

對於專業的脣讀者來說,他們會藉助其他方式來增加還原脣語的準確性,比如根據所談論話題去聯想、根據面部表情和手勢等因素去推測。還有一點就是,對於聾啞人和專業的脣讀者來說,讀取那些經常互動的人的脣語會更容易。

研究者收集了一個120小時的視頻數據集,其中5位講話者在不受約束的環境中進行自然陳述,並設立一種基於脣部動作生成語音的序列 Lip2Wav 對視頻進行分析,與之前的同類模型相比,Lip2Wav 在不受約束環境中生成語音的清晰度提高了接近 4 倍,在人工評估方面也顯示,該模型生成語音的韻律更加豐富自然。

信息來源:百度AI

05

本週論文推薦

【ACL 2020 | 百度】:同聲傳譯中的啓發式算法

Simultaneous Translation Policies: fromFixed to Adaptive

論文介紹:

同聲翻譯是機器翻譯中的一個重要問題,它不僅要求高質量的翻譯結果,而且要求翻譯的過程有較低的時延。同聲翻譯的過程可以認爲是一個選擇“讀”或“寫”的決策過程,而所採用的策略則決定了同聲翻譯的質量與時延。

本文提出一種簡單的啓發式算法,根據翻譯模型輸出的概率分佈,可以將幾種精簡的固定“讀寫”策略組合成一種靈活的策略。本文進一步將該算法與集成方法相結合,既提高了翻譯質量,又降低了翻譯過程的時延。這種簡單的算法不需要訓練策略模型,使得其更易於在產品中使用。

END

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章