決勝人工智能之巔:核心算法缺失背後的中國“AI”困局



來源 |  五矩研究社(ID:kejiwuju)

作者 | 劫鏢


未來,人工智能會區分國籍嗎?


看似這是個滑稽的問題,在華爲事件之後,引發了很多技術從業者,在和平時期對“人工智能”極限生存的思考。


01谷歌又一 AI 項目擊敗 6 位專家


日前,在《自然》雜誌醫學版上報道了一則谷歌 AI 團隊的最新人工智能研究成果——預測肺癌。


640?wx_fmt=png


通過一套卷積神經網絡算法,谷歌 AI 部門建立了一種端到端的分析方法,僅從 CT 圖像就可以預測肺癌的風險。


在 6716 個測試病例中,這套人工智能系統能夠以 94% 的準確率發現了極小的惡性肺結節,打敗了 6 名放射專家(並非普通醫生)。


在無先前 CT 掃描圖像的情況下,該系統的表現超越所有 6 位放射醫學專家。而在有先前 CT 掃描圖像的情況下,兩者表現不相上下。


而參與測試的 6 位放射專家,有平均 8 年( 4 年到 20 年)的讀片經驗。


相比“傳統”射科醫生的行醫方法,醫生必須審查數百個單獨的 2D 掃描切片以發現問題,而腫瘤可能會很微小導致難以察覺,這種新的機器學習算法則可以分析高通量的 3D 肺部圖像,不僅可以對整體腫瘤進行預測,還可以通過肺結節識別細微的惡性組織。再加上先前的掃描數據對比,就可以用來評估肺結節的生長速度。


相關論文共同作者,美國西北大學醫學院 Mozziyar Etemadi 博士表示,3D 檢測早期肺癌的能力比人眼檢測 2D 圖像要敏感得多。事實上,新系統在技術上可以納入 4D 範疇,因爲它不僅僅是一次 CT 掃描,而是包括了當前和先前共計兩次的掃描,所以可以檢測出肺結節隨時間的生長變化。


2019 年 5 月 7 日,Lily Peng 在 2019 年開發者大會上稱,他們研發的人工智能技術可以比醫生早一年查出肺癌,使患者存活的概率提升 40% 。


毫無疑問,通過谷歌的這項技術,可以造福更很多人。在 2015 年,中國肺癌的發病和死亡例數分別達 73萬 和 61 萬,發病率和死亡率非常接近,其主要原因是臨牀診斷病例多已爲晚期,失去了手術機會。


然而,或許有一天我們分享不到這份成果。對於華爲中興事件的反思,面對美國接下來可能在各方面實施的技術封鎖,中國人工智能的發展還需要再加把勁。


02我國 AI 進展——算法的錯位缺失


我們以前討論電腦或者移動終端時,離不開硬件、軟件和應用的範疇。討論人工智能時,同樣離不開硬件、算法和數據這三個要素。


簡單來說,中國人工智能發展在硬件上的差距,遠沒有在算法的差距來得大。


計算機硬件技術的發展一直伴隨着通用性和專用性的矛盾,通用的設計普適性強,但對於某一類特殊計算,性能就會打折扣,如果做個比喻的話,就是瑞士×××和菜刀的區別,也可謂術業有專攻。


在這樣的背景下,人們開始研發用於神經網絡算法和機器學習的專用芯片。


如今,以通用圖形處理器(GPGPU)爲基礎的 NVIDA 在深度學習市場佔有一席之地,谷歌憑藉 16 年發佈的張量處理器(TPU)成爲後起之秀。


通過與自家的人工智能開發系統 TensorFlow 相結合,谷歌也形成了一套完整的人工智能開發環境。


國內人工智能芯片創新同樣非常活躍,在人工智能芯片的競賽中與國外不相上下。其中的明星企業就是最近兩年來被反覆提及的獨角獸公司“寒武紀”,取名借用地質學“寒武紀”時代的概念,比喻即將到來的人工智能大爆發時代。


640?wx_fmt=png

寒武紀Cambricon-1H8


此外,百度深度學習實驗室前主任餘凱創立的地平線也同樣值得關注。一年多時間就完成了 Intel 和 SK 領投的兩輪過億融資。


但是無論是寒武紀還是地平線,都還無法和美國企業完全抗衡,美國不僅有 NVIDIA 和谷歌,還有英特爾、微軟和 IBM 等一批大企業每年將巨資投向人工智能領域。


至於另一大要素——數據,鑑於中國龐大的互聯網人口,深度學習所需要的大數據則可以由國內用戶提供。


人工智能發展所需的三個要素中,算法是目前我們最薄弱的一環。不論是前面提到的谷歌 AI 卷積神經網絡測癌算法,或是 NVIDIA 此前大火的 GauGAN 畫圖,都證明了美國企業的領先,而我國在這方面的發展屬於相對滯後的。


在 2019 年長江商學院和清華大學公佈的兩份報告中,均指出了中國人工智能發展基礎薄弱。


長江商學院人工智能與制度研究中心主任許成鋼教授對記者表示,在人工智能領域,中國發表的論文總數雖然超過了美國,卻在深度學習、機器人流程自動化、以及包括推理學習等在內的其他領域,從發表總數和引用率方面,與美國的差距顯著。


對有高質量、高影響力的千級論文(是指每一篇論文被引用的數字超過了 1000 次),中國與美國差距巨大,中國只有個別的論文影響力能達到這個水平。


爲什麼中國很多論文從來不被引用?許成剛認爲的癥結之一在於我國科研機構只注重數量,不注重深度。 “我個人分析,在中國體制內大學有一個 SCI 現象,即就是教授的水平高低,或者職稱評定,就是看教授發了多少篇 SCI 文章(美國科學資訊研究所採用的期刊文獻檢索工具),不管你這篇文章到底有多大的影響力。”


知乎一篇相關問答下也不難看到,論文換湯不換藥的做法幾乎已成爲除頂級機構之外相當普遍的做法。


這也導致了我國空有 4 倍於英國的論文發表數量,然而論文影響力竟反而不如英國的結果。


同時,幾乎 93% 的中國研究者使用人工智能開源軟件包,這也是美國的機構開發提供的。中美兩國人工智能研究者使用最多的軟件庫就是前面提到的 Google TensorFlow。在 2018 年初,中美研究人員對此的關注人數,分別達到將近 9000 人和約 7000 人。


640?wx_fmt=png


整體上中、美 AI 研究者關注美國機構開發的開源 AI 軟件包的數字,相當於他們關注中國機構開放的軟件包數字的 20 幾倍。這表明中國研究者在基本算法方面,對美國開源軟件包的嚴重依賴。


新智元創始人楊靜 18 年曾對《環球時報》記者表示,人工智能平臺分硬件和軟件,核心技術一直掌握在西方手裏,比如芯片技術。此外,中國沒有主流開源框架也是很可怕的,深度學習、強化學習等算法的研究也落後於西方。


在牛津大學最新完成的一份報告《解碼中國 AI 夢》裏,作者也得出了相同的結論。除了數據,中國在硬件、人才、算法和產業等方面,仍然落後於美國。但編寫這份報告的 Jeffery Ding 仍表示, “我認爲 AI 是中國第一個真正有機會制定遊戲規則的技術領域。”


實際上,正是由於中國龐大的互聯網人口,提供了強大的數據基礎,在市場的導向之下才使得我國的人工智能更偏重具體應用。對此,IDC 公司在一份報告中稱:“數據或許不會出現在資產負債表上,但數據是一個公司最寶貴的無形資產。中國初創企業尤其懂得如何利用海量數據打造雙贏的商業生態。”


03人工智能競賽終將走向人才競爭


科技競爭的本質最終還是人才的競爭,美國人工智能相關的從業人員和公司數量現在也遙遙領先。


2012 年前,中國活躍的人工智能創業公司還要多於美國,但是在 2012 年卻被美國反超,美國與人工智能有關的企業數量遠超中國。


據《中國人工智能指數2018》分析,美國的人工智能工程師遠比中國多。


據領英(LinkedIn)人才數據庫顯示,中國的 AI 人才總數爲 5 萬人,而美國的 AI 人才總數爲 83 萬人。美國 AI 人才總數是中國的 16.5 倍之多。並且,中國人工智能領域工作 10 年以上的人才不到 39%,相比之下,美國超過 71% 的人工智能領域的人工作了 10 年以上。


640?wx_fmt=png

來源:長江商學院《中國人工智能指數報告》


“在中國,人工智能是更年輕的行業,而在美國雖然領域是年輕的,但是裏面的多數人並不年輕,是有充分經驗的。”許成剛說。


人才分佈方面,中國在智能交通/自動駕駛,智能/精準營銷, 硬件/ GPU /智能芯片需求比例要多於美國,但美國在算法、機器學習的方面,美國不但人才的比例比中國大,人才總數也是中國的 20 多倍。


640?wx_fmt=png

來源:清華大學中國人工智能發展報告2018


但隨着美國對外開放的收縮,當下也給了很多海外的技術型人才回國發展的機會。


實際上,早在 2017 年 12 月美國發表的“國家安全戰略”中便公開表示:將限制世界上所有去美國學習 STEM 專業(科學、技術、工程、數學)的留學生簽證。


根據南華早報的說法,在美國 363341 名中國學生中,約有 36% 的人在 STEM 領域學習。


這次美方設置的障礙,可能將會給更多在美國的中國留學生,在美尋求工作的中國人帶來危機和恐懼。


站在人工智能角逐的角度來看,美國反而在這方面有點自縛手腳的意思。


640?wx_fmt=png

澎湃新聞:美國埃默裏大學涉嫌歧視華人教授


最爲關鍵的一環還是在於國內要加強對於基礎教育的重視和投入。


“我關心教育不是關心華爲,是關心我們國家。如果不重視教育,實際上我們會重返貧窮的。” 5 月 26 日晚間,華爲創始人、CEO 任正非在央視《面對面》節目中說道,因爲這個社會最終要走向人工智能的。


在任正非看來,能與基礎研究相提並論的是基礎教育。他認爲,我國目前基礎研究方面水平不夠,和基礎教育跟不上直接相關。爲此,他曾自費請權威機構的專家進行中國基礎教育狀況的調查研究。


儘管中國還沒有人工智能的企業燒到美國的核心技術腹地,但從美國近日的一些列無底線操作中不難看出,科學組織和科學家,甚至技術都是可以分國籍的。


假設美國因爲“數據隱私保護”等原因禁止了世界所有國家對微軟 GitHub 或者谷歌 TensorFlow 的訪問,屆時,世界上還有哪家公司有實力,成爲第二家有“備胎”的公司呢?


|| 推薦閱讀 ||


鏈接圖片2.png

https://mp.weixin.qq.com/s/pOFPqwxl1ezWwmaVGrc8bQ


鏈接圖片1.png

https://mp.weixin.qq.com/s/OwnWK8lT4Hlyf6shu4q6ig


640?wx_fmt=gif數智優質活動推介640?wx_fmt=gif


由上海市經濟和信息化委員會、上海市商務委員會、上海市長寧區人民政府指導,上海市長寧區青年聯合會、億歐公司聯合主辦的“ 2019全球新經濟年會-產業互聯網峯會”將在上海長寧舉辦。


本次大會邀請了慧聰集團、甲骨文、盛景網聯、千方科技、找鋼網、金山雲等產業巨頭 ,明勢資本、遠望資本、阿爾法公社、賽意產業基金等產業互聯網一線投資人。產業互聯網從業與創業者將共同參會交流產業互聯網的未來,共話產業變革新機遇。


大會截止日期6月13日,感興趣的小夥伴可“掃描下方海報二維碼或點擊“閱讀原文進行活動報名和查看大會議程安排。


111.jpg

活動頁面鏈接:https://www.iyiou.com/a/cyhlw_shanghai_2019/

掃描海報二維碼 或 點擊閱讀原文

進行“活動報名”以及“查看大會議程安排



640?wx_fmt=png


640?wx_fmt=jpeg


星標我,每天多一點智慧

640?wx_fmt=gif



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章