張鈸院士:探索第三代人工智能,需要勇闖無人區的人才!

整理 | 夕顏
出品 | CSDN(ID:CSDNnews)

【導讀】7 月 3-4 日,由 CSDN 主辦的第三屆 AI 開發者大會(AI ProCon 2020)在線上舉行。本次大會有超萬人報名參與,參與人羣覆蓋 50+ 領域、4000 家企業。其中有來自行業內 70+ 頂尖企業、開源社區與科研高校的近 100 位行業領袖、技術大咖與研究學者。

他們用更新鮮、更有趣、更年輕的方式,聚焦智能時代 AI 技術的發展曲線以及 AI 與社會各行業結合的最新應用進展,深入解析熱門 AI 技術在行業中的實踐與落地經驗,揭示技術與行業發展面臨的機遇與挑戰。

在 7 月 3 日的主論壇上,清華大學人工智能研究院院長、中國科學院院士 張鈸 帶來了 《人工智能的發展現狀與人才培養》 的主題演講。

在這裏插入圖片描述

核心觀點: 人工智能經歷了兩種發展範式:符號主義和連接主義,我們分別稱之爲第一代和第二代人工智能,這兩種範式發展至今都遇到瓶頸,從而觸及天花板。今後發展的方向是第三代人工智能,這是一條前人沒有走過,需要大家去探索的道路,將對科學研究、產業化和人才培養產生重大影響。

以下內容爲演講實錄,由 CSDN(ID:CSDNnews)整理:

我是清華大學人工智能研究院的張鈸。大家知道,人工智能的發展歷經兩種發展方式,一個是符號主義,另一個是連接主義,我們把符號主義叫做第一代人工智能,把連接主義叫做第二代人工智能。但是這兩種發展模式/發展方式今天都遇到了瓶頸,觸及了天花板。今後發展的方向是第三代人工智能,而這是一條前人沒有走過的,需要大家去探索的道路。

第三代人工智能的發展將對科學研究產業化和人才培養有什麼影響呢?下面我們來具體說明。

第一代人工智能-符號主義

在這裏插入圖片描述

第一代人工智能就是大家所說的符號主義,實際上它是建立了一個知識和推理的模型,來模擬人類的理性的智能。在具體應用上,就是利用了知識和推理,構造化學結構分析系統、計算機硬件組合系統、血液傳染病診斷處方等系統。

在這裏插入圖片描述
我們回過頭來看,會發現建立MYCIN醫療診斷專家系統,其實就是把傳染病專家的知識和經驗放在知識庫中,把醫生看病的過程,如何從症狀推斷疾病,再推理出處方的推理機制放在計算機中。這樣,內科醫生通過與計算機的交互,就可以通過計算機幫助他/她來診斷血液傳染病。

在這裏插入圖片描述

這種用知識和推理建立的模型,主要是用來模擬人類的理性智能,它的代表性成果是國際象棋。國際象棋是完全信息博弈,實際上與決策、規劃、診斷、設計和調度等,都屬於理性智能/理性分析。這個系統打敗了人類國際象棋冠軍卡斯帕諾夫,這就說明這樣的系統在一定的條件下能夠超過人類的水平。

這種系統成功的祕訣在什麼地方?也就是說第一代人工智能成功的祕訣,主要有下面三個因素:

在這裏插入圖片描述

一是依靠知識和經驗。以IBM深藍爲例,它分析了70萬盤象棋大師下過的棋,還有全部5~6個棋子的殘局。根據這些殘局和大師下過的棋,總結出來下棋的規則。同時又通過大師和機器的對弈,對有8000個參數的評價函數進行調整,這樣就可以把大師的經驗也放到程序裏。

第二個因素是算法。當時深藍主要常用採用的是α-β剪枝算法。

最後一個是算力,當時深藍使用的是IBM RS 6000 SP2,大體上每秒鐘可以分析2億步,平均來講是每分鐘能夠搜索8-12步。

第一代人工智能的優勢

在這裏插入圖片描述
我們看一下第一代人工智能的優點。它可以模仿人類的理性智能。首先,它可以解釋,可以和人類一樣基於知識進行推理,我們不僅可以用來作爲理性分析的模型,同時基於知識也可以用來進行機器學習。這種基於知識的符號學習,可以克服基於數據驅動機器學習方法的缺陷,也就是深度學習方法的那些缺陷,比如不可解釋性,推廣能力很弱,需要大量的數據等。

第一代人工智能的侷限性

在這裏插入圖片描述

但是,第一代人工智能最主要的侷限性,體現在它不能隨機應變,即基本上只能解決完全信息和結構化環境下的確定性問題。比如下國際象棋就是一個完全信息的,並按照一定規律演化過程。另外,無論是IBM的深藍,還是MYCIN醫療診斷系統,所有的知識都是用人工來編制的,所以在知識自動獲取和表示上目前還有一些困難。此外,還有一個侷限性是涉及到不確定性的知識與推理,第一代人工智能還沒有很好的解決辦法,導致其應用的範圍有限。

第二代AI——深度學習

在這裏插入圖片描述
第二代人工智能,也就是我們現在非常熟悉的深度學習,有時也被稱爲亞符號模型,或者連接主義方法。它實際上是通過模擬人類的神經元、神經系統的機制來模擬人類的感性智能/感知(主要),其基本方法如圖左所示,把圖像/語音直接輸入到人工神經網絡中。所謂人工神經網絡實際上就是一個算法,對輸入的信息進行分類,比如這個圖像究竟是馬還是牛。

在這裏插入圖片描述

因此,深度學習在模式識別上,就是將原始輸入數據進行分類,其重要特點是不需要領域知識。過去我們要識別一幅圖像,必須人工選擇合適的特徵。有了深度學習以後,把原始圖像的像素輸進去就可以識別。這說明在深度學習中,我們不需要圖像相關的知識和語音知識,直接把圖像和語音的原始信號輸進去就可以,這就使得使用門檻降低,沒有專業知識的人也可以使用深度學習。

第二代人工智能的第二個優點是,因爲深度學習是使用多層神經網絡,這就賦予其強大的學習能力,因此能夠處理大數據。

在這裏插入圖片描述

最後,深度學習第二代人工智能主要依靠三個要素:數據、算力,還有算法。使用深度學習以後可以解決很多實際問題,比如圖像識別、語音識別的識別率有了大幅提升,2011年在IBM和微軟在ImageNet上的圖像誤識率爲50%,4年之後使用深度學習後誤識率降到3.57%,實際上超過人類的水平。

第二代人工智能的侷限性

但是第二代人工智能也有很大的侷限性,最重要的是不能舉一反三。

在這裏插入圖片描述
首先,它不可解釋,也就是說它可以分辨牛或馬,但是我們不知道它的根據,因爲這是根據多層神經網絡計算得出的結果。 第二點是不安全,非常容易受攻擊。第三是不易推廣,最後一點是需要大量樣本來學習。在視覺領域的安全性尤其令人擔憂。

在這裏插入圖片描述
比如左邊第一張圖是一個停止的交通信號,我們只要在交通指示牌上加入一點噪聲,圖中是加上了幾個白塊和黑塊,它卻識別爲限速45公里。再比如在圖中最左邊的坦克側面塗上一些顏色,機器就將其誤識別爲校車。這說明,利用深度學習來構造的圖像識別系統非常不安全,非常容易受攻擊。

人工智能產業現狀:大部分不盈利、應用場景有限

在這裏插入圖片描述

利用第一代人工智能技術和第二代人工智能技術構造的系統有什麼問題?用這些技術來進行產業化目前的現狀是怎樣的?

我們可以看到,目前人工智能在很多領域得以應用,包括交通、醫療、安保、智慧城市、家庭服務、智能製造、金融等,同時可以看到這些領域中的人工智能企業數量很多,但是規模很小,大多數是幾十人到幾百人的規模,千人以上的大企業很少。

人工智能產業的第二個特點是大部分沒有盈利。原因就在於第一代人工智能和第二代人工智能技術的侷限性,主要表現在兩個方面,一方面是現有技術的應用場景有限,只能應用到那些結構化、靜態的環境中,比如把現有的第一代和第二代人工智能技術應用到自動駕駛場景中時,如果交通狀況比較複雜,就很難應用。

第二是技術本身有侷限性。所以,爲了使得人工智能的研究工作有進展,特別是爲了讓企業做大做強,我們必須要發展第三代人工智能的理論和技術。

邁向第三代人工智能需要突破一些理論、方法與關鍵技術

在這裏插入圖片描述
第三代人工智能理論和關鍵技術主要爲以下三點:

第一,我們必須要探索出可解釋和魯棒的人工智能理論。換句話講,現在的第一代和第二代人工智能都不夠好用怎麼辦?第二個就是要發展安全、可信、可靠和可擴展的人工智能技術,從而推動人工智能的創新應用。

在這裏插入圖片描述

第三代人工智能的優點有哪些?

如前所述,第一代人工智能符號主義的模型依靠的是知識、算法和算力。第二代人工智能,即亞符號模型/連接主義模型主要依靠的是數據、算法和算力。我們現在發展第三代人工智能,最主要的措施就是把第一代人工智能知識驅動的方法和第二代人工智能數據驅動的方法結合起來,這就可以使我們充分地利用4個要素——知識、數據、算法和算力,特別是算法,即如何去研究新的理論和方法。

下面介紹一下這方面的工作。

在這裏插入圖片描述

在第一代人工智能中,我們做過的一些專家系統,但這些專家系統的規模都比較小,實用性較差。那麼我們現在介紹一下在這個方向上做的努力,最典型的代表是美國的沃森系統。
在這裏插入圖片描述

大家知道沃森系統是一個很成功的人工智能系統,它在全美的電視智力競賽中打敗兩個全美冠軍。它與第一代人工智能相比不同之處在哪裏?

當時要建立專家系統,主要的知識和經驗來自於專家,比如MYCIN系統傳染病的診斷系統,它的知識主要來自於傳染病專家。而專家知識是非常昂貴和稀缺的,而且要把專家的知識表示在計算機中,非常耗時耗力,即使是規模不大的MYCIN系統也需要三年才能做出來。主要的挑戰是如何擴大人工智能的規模,使其更加實用化,最重要的方法是引進大量的數據。

網絡上有大量的非結構化的數據,我們如何自動地把這些非結構化的數據變成計算機可用的語料庫,這個問題在沃森系統裏得到很好地解決。

有了大量的語料庫後,沃森可以利用多種推理機制來解決“問答”的問題,經過對“問題”進行分析與分解,從語料庫中找出候選答案,對候選答案進行評分和排序,最後輸出問題的答案。

人工智能改變醫療行業

在這裏插入圖片描述

人工智能應用中另一個大的問題是如何使人工智能技術更加可靠、可信。以醫療系統爲例。“醫療”主要有三個要素——醫務人員、病人和醫療設備和醫療技術。隨着醫療技術的發展,醫生可以利用先進的設備和技術對病人進行更加高效、準確的診斷。即使設備和技術有巨大的變化,醫務人員和病人的關係始終沒有變,也就是說醫務人員利用設備和技術爲病人治病,所有責任都在醫務人員身上,所以病人去看病,主要取決於對醫務人員的信任。

在這裏插入圖片描述
設備技術智能化會對醫務人員和病人關係起到什麼作用呢?由於智能化的設備和技術也參與到診斷過程和疾病的分析過程,這樣就產生一個問題,病人和醫務人員是否信任設備和技術做出的診斷和決策。所以,當設備智能化以後,我們需要建立一套互信、可靠、高效運行的新醫療系統。

目前的技術,包括人工智能技術,還不足以建立起醫生、患者和機器三者之間的信任關係。以醫學圖像識別爲例,假如計算機分析 x光片,診斷出病人患有肺癌,但是目前用深度學習方法做出的診斷是不可解釋的,醫生也無法信任這個結果。所以,只有解決了深度學習圖像識別不可解釋的問題,纔可以建立起病人對診斷結果的信任。

換句話講,我們要想讓這些人工智能技術在醫學診斷中發揮更大的作用,就必須提高它的可信度、可靠性和可解釋性等。

在這裏插入圖片描述
另外,機器人在服務行業、製造業中有大量應用,比如手術機器人。可以看到,這些機器人的應用場景基本上是結構化的環境,即環境基本上是固定不變的,服務機器人目前在這個領域的應用較多。但是像自動駕駛工作在非結構化環境下,應用就困難得多。所以,我們要想讓機器人在更多的領域中應用,也必須解決隨機應變等魯棒性等問題。

我們需要勇闖無人區的創新人才!

以上是人工智能的發展現狀,從發展現狀出發,我們來分析一下未來對人工智能人才培養的要求。

首先,目前發展到第一代和第二代人工智能,我們遇到了瓶頸,需要發展新的第三代人工智能,大家都在探索一條前人都沒有走過的道路,因此,無論是對科學研究、開發還是產業來說,都需要有從0~1的創新,因爲我們沒有辦法沿着前人已經走過的路走,所以,技術人員、開發人員和企業家要有一種精神,敢於闖無人區,這是一個很重要的要求。

第二,技術人員,包括管理人員不僅要能夠解決問題,更重要的是能提出問題和發現問題。在大學和研究生培養計劃下,我們的重點都是在培養解決問題的能力,而在發現問題和提出問題上有所不足。因此,對這樣的人才培養必須是提出問題和解決問題的能力並重。
第三,能夠理論與實際結合,技術和產業結合。

最後,人才不限於科技人才,還包括管理人才,人工智能企業要想做大做強,必須很好地把資本市場和技術結合起來。因此,我們不僅要培養科技人才,也需要各種各樣的管理人才,但不管是管理人才和技術科技人員,創新是最主要的要求。

謝謝大家!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章