演講實錄丨中科大陳小平教授《從封閉性到非封閉性：2020到2035年智能機器的機遇和挑戰》...

來源：中國人工智能學會

陳小平

中國科學技術大學機器人實驗室主任、教授

以下是陳小平教授的演講實錄：

非常高興有這個機會進行中、新學術交流。本報告包括四方面內容。第一，關於人工智能（簡稱AI）的兩種類型，一種是Thinking machines；另一種是Intelligent machinery。它們之間有比較大的區別，智能機器人屬於後者。第二，用人工智能的觀點來看機器人領域，我們認爲核心挑戰是降射，英文是grounding，但是我對“降射”給出了不同於文獻中的其他定義。第三，在這樣一種挑戰下，現有人工智能技術有沒有可能大規模產業應用？這是有爭論的。有人認爲是不能應用的；我們的觀察是：在滿足封閉性條件的場景中，現有人工智能技術已經可以大規模應用了。第四，封閉性要求是比較強的，有些應用很難滿足封閉性要求，所以存在另一個挑戰：如何超越封閉性？我會和大家分享中科大機器人團隊在過去10 年中爲超越封閉性所做過的一些嘗試，主要有開放知識和融差性原理這兩方面的研究。

關於兩類人工智能，這個觀點是圖靈提出來的。圖靈在1950年的文章中提出圖靈測試，這是非常重要的。可是在1948年圖靈還有一篇文章，我覺得更加重要，這篇論文始終沒有正式發表。這篇手稿的標題就叫做Intelligent machinery（智能機器）。圖靈提出，智能機器就是“用機器替代人的每一個部分”，而且舉了具體的例子——無人駕駛汽車。所以無人駕駛汽車是圖靈設想過的。但是他分析後認爲，在當時的技術條件下，是沒辦法研究Intelligent machinery 的，所以提議先研究沒有感知和行動能力的thinking machines（思維機器）。圖靈測試就是針對Thinking machines 的，他還建議了一些具體的研究課題，包括圍棋、語言學習、機器翻譯等。所以，實際上圖靈考慮了兩類人工智能——思維機器和智能機器。

我把兩類AI 的根本區別總結在圖1裏。事實上，人工智能涉及三層空間——現實層、數據層和知識層。如果只考慮上面兩層，即數據層和知識層，這就是思維機器；如果同時考慮全部三層，就是智能機器。它們之間最重要的差別是：智能機器要涉及感知和行動，而思維機器則不涉及感知和行動，至少不涉及行動。機器人自然屬於智能機器，要同時涉及三層空間。

圖1 人工智能的三層空間

在過去的六七十年時間裏，人工智能有三次浪潮。我們回顧一下，主流的研究有兩大類，一類是訓練法，包括深度學習；還有一類是強力法，包括推理和知識系統。強力法是第一、二次浪潮的主力，現在關注的人較少，但強力法並沒有消失，只不過換了一個賽道，我稱之爲“大知識”，國際上流行的術語是Knowledge technologies。

2017年AlphaGo Zero 獲勝，我認爲這標誌着第三次浪潮的結束和第四次浪潮的開始。我們是這樣看待當前和未來人工智能發展態勢的。

關於第四次浪潮，其他的學者也有類似的看法，比如深度學習團隊，從2017年開始就在多次演講中提到他們的深度學習2.0計劃。在2020年8月29日中國人工智能大會的特邀報告中，Y.Bengio 教授給出了一個更加完整的DL2.0方案。值得注意的是，該方案中他們計劃研究的目標功能，居然都屬於強力法！與強力法途徑不同的是，他們想用深度學習來實現這些功能。

強力法有模型、推理機/ 搜索算法和優化三個主要成分，其中模型是關鍵。對於思維機器來說，模型就是知識庫，存儲的是抽象知識；對於智能機器來說，模型包含知識庫和模型降射兩部分，其中模型降射是知識庫到現實世界的對應。

圖2中有一個推理機（推理程序），還有知識庫+ 降射。假設想讓機器人在就餐過程中幫助我們，就需要編寫一個知識庫，描述就餐的相關知識，比如“餐具可以盛食物”“米飯是食物”等。寫了這些知識之後，就可以向推理機提問，比如：“碗能不能盛米飯”？這個問題在知識庫裏是沒有描述的，但經過推理, 強力法AI 會回答yes。再問“碗能不能盛湯？”推理機回答yes，問“碗能盛什麼？”回答“能盛米飯、湯……”。一般而言，凡是知識庫在邏輯上隱含的所有碗能盛的東西，推理機都能找出來，所以編寫知識庫不需要寫出全部知識；還可以向推理機提問更復雜的問題。上述這些都是思維機器研究的內容，可以不涉及降射。

圖2 強力法的降射挑戰

對於智能機器人來說，只有知識庫不夠，還必須考慮降射。知識庫裏的每一個符號所代表的現實世界中的對象，都要通過降射對應起來。比如，知識庫中的符號bowl 代表現實世界中的碗，這個對應就要通過降射來實現，否則機器人只知道一個空洞的符號bowl，卻在現實世界中找不到碗，於是也就無法完成用戶交給它的相關任務（比如“盛飯”“盛湯”等）。表面上看，這件事情很簡單，其實包含着很大的難題。比如有一個碗，看起來像盤子，但其實是宋代的汝窯碗，所以也是碗，也要在降射裏把它和bowl 對應起來，這樣機器人才能夠找到這隻碗。

更有挑戰性的是下面這個例子：破碗是不是碗？通常認爲，破碗也是碗，於是我們在降射中把破碗也和bowl 對應起來。這麼做的結果是什麼？剛纔看到了，推理機推出的一個結論是：碗能盛湯，而且這個推理和降射無關，所以現在推理機仍然會推出“碗能盛湯”，但現在碗實際上是包含破碗的，所以機器人可以用破碗盛湯，這顯然是錯誤的！由此可見，不適當的降射可導致知識庫出大問題，因此破碗不能在降射中與bowl對應，這樣破碗就變成一個未知變元。一般情況下，AI 設計者能不能預先想到所有未知變元？這就是著名的“知不知”（How to know unknown）問題，是一個非常難的問題。

再看訓練法。在一個圖像分類比賽中，一個神經網絡只要用帶標註的數據訓練好了，能以很高的準確率識別1000類對象，其中一類是衛生紙。下面我們問：髒的衛生紙是不是衛生紙？如果衛生紙是拿來用的，而不是僅僅要求分類，那麼髒的衛生紙就要和衛生紙區別開，這就意味着：被分類的對象不是預先設計好的1000類，而是1001類。這是降射問題在訓練法中一種表現，我們在訓練法中同樣遇到了“知不知”問題：能不能提前想到所有未知變元？如果想不到，如何收集相關的數據，訓練出合適的神經網絡？所以，訓練法（包括深度學習）並沒有給出降射問題的解決方案，同樣面臨着降射挑戰。

一般地說，降射挑戰背後的原因是場景變異無盡性：人們通常只想到典型場景和一部分非典型場景，其他沒想到的可能場景到底有多少、有哪些，是不知道的。而這些無法提前想到的場景往往與想到的場景有所不同，即出現某種“變異”，而變異場景往往包含着未知變元（如破碗或髒衛生紙），它們的出現可導致已經建好的AI 模型（知識庫和神經網絡）失靈。

由此我們得到一個一般性的觀察：在正常情況下，任何AI model，無論是強力法還是訓練法的模型，都會丟失一些變元。由於目前強力法和訓練法都不能有效處理未知變元或丟失變元，所以都無法勝任存在場景變異無盡性的應用。這是目前人工智能遇到的一個根本性挑戰。

面對這個挑戰，現有人工智能技術是不是就無能爲力了？也不是，有一個簡單的辦法——封閉性準則：把典型場景和一部分非典型場景選出來，把它們封閉化，而其他場景都被排除，可以不考慮。這裏的“不考慮”不是簡單的忽略，而是通過採取具體措施，保證不考慮的場景即使出現了，也不會產生致命的後果，不會影響應用。這套方案叫做封閉性準則。

我發現，阿爾法狗也是符合封閉性準則的。我把第四代阿爾法狗的工作原理總結成一張圖，說明它在圍棋博弈樹上下棋的原理。圍棋棋盤有361個落子，另外還有一個特殊的落子pass，所以黑棋的第一步棋總共有362 個落子，第四代阿爾法狗直接選其中勝率估計最大的那個落子。白棋的第一步棋也是類似的，但是少一個選項，只有361個落子可選。如果是第四代阿爾法狗走棋，它也是選擇勝率估計最高的那個落子走。之後黑棋和白棋的決策原理是一樣的，總是選擇當前可選落子中勝率估計最高的那個落子走。

由於圍棋博弈樹上總共有大約10300種不同的棋，太多了，落子的勝率估計沒辦法實際計算出來。第四代阿爾法狗用蒙特卡洛樹搜索，自己和自己下了2900萬局棋（自博），從這些自博數據中反推出了所有落子的勝率估計，保存在一個深層殘差網絡中。之後，它下棋就是按勝率估計的進行決策，根本不考慮不同的對手的下棋策略有什麼不同。實驗結果是，四代以100比0戰勝了三代，而三代戰勝了所有人類圍棋高手。阿法狗四代沒有和人下過，因爲它的博弈水平遠遠超過了人類。

阿爾法狗第四代有哪些核心技術？他們2017年的論文裏說得非常清楚，只有四項核心技術，其中前兩項是強力法，後兩項是訓練法，而且有一個重大創新，就是簡化的決策論規劃模型。爲什麼簡化模型可以成爲重大創新？論文裏沒有說，我幫它說清楚了，這個重大創新就是遵守了我提出的封閉性準則。

封閉性準則對強力法有三個條件，對訓練法也有三個條件，我發現阿爾法狗四代都是符合的。封閉性的具體描述，以及阿法狗符合封閉性的詳細情況見圖3。

圖3 封閉性準則

阿法狗的成功及它之前的相關研究表明：雖然強力法、訓練法和它們的結合都解決不了圍棋問題，但是把圍棋問題封閉化之後，用強力法和訓練法的結合就可以戰勝人類，並遠超人類。這是人工智能第三次浪潮取得的重大突破，是人工智能發展史上的一個新的里程碑。

在《智能系統學報》2020年1期的文章中，我提出現有人工智能技術的一個可行應用模式：將應用場景封閉化，根據需要應用強力法、訓練法以及它們的結合。這個模式是我從過去5 年的產業調研中發現的，適用於這個模式的場景非常多。這個模式中的封閉化包含完全封閉化、半封閉化和柔性化，需要企業研發人員根據應用的實際情況展開，所以他們是未來15年人工智能產業落地的主力軍。

最後簡單提一下超越封閉性的問題，過去10年裏，中科大機器人團隊做過一些嘗試。這張圖裏是我們的“可佳機器人”，它的預期目標是在家庭環境中當機器人保姆。我們使用了強力法和訓練法，但仍然有一些問題不能解決，所以提出了“開放知識”和“融差性”原理。應用這兩種辦法，可以讓可佳機器人在非封閉性場景中更好工作，比如完全自主地操作微波爐加熱食品。最初版本在2010年就實現了基本功能，但環境一旦發生改變，機器人可能就無法正常完成任務。去年我們得到一個改進版，人可以給機器人搗亂，破壞機器人工作的條件，這是體現環境變化的一種方式，在實際應用中也經常發生。在這種情況下，可佳機器人依然可以正常完成任務。我們還研製了一種柔性手爪，它不需要獲得準確的信息，就能抓很多不同形狀、大小和硬度的東西，比如能“一視同仁”地抓木塊和豆腐。其中的主要原理就是融差性。還有情感交互機器人“佳佳”，也是在非封閉性條件下工作的。現在的一項主要研究是要識別非關鍵詞意圖，這種用戶意圖是用關鍵詞無法表達的。

最後對未來15年做一個展望。首先是大規模產業應用，根據封閉性準則，只要對應用場景做封閉化，現有人工智能技術就能成功應用。所以，大批企業無需等待更強大的人工智能技術的出現，就能實現很多行業和產業部門的轉型升級。

第二點展望。在未來15年中，人工智能的發展模式會發生一個重要的轉變，過去完全是基礎研究驅動的，而未來15年中大規模產業應用將成爲主要驅動力，而且中低端產業是驅動力的主要來源，因爲中低端產業是和用戶的需求直接掛鉤的，是最能反映用戶需求的改變。同時，基礎研究將在AI 的更深層次展開探索，從而爲2035年之後的產業應用奠定基礎。

第三點展望是關於人工智能倫理的，這也是當前的一個重大課題，同時也是未來戰略競爭的一個新維度。過去的競爭是產業競爭，後來變成產業+ 科技，現在正變成產業+ 科技+ 倫理。

（本報告根據速記整理）

未來智能實驗室的主要工作包括：建立AI智能系統智商評測體系，開展世界人工智能智商評測；開展互聯網（城市）雲腦研究計劃，構建互聯網（城市）雲腦技術和企業圖譜，爲提升企業，行業與城市的智能水平服務。

如果您對實驗室的研究感興趣，歡迎加入未來智能實驗室線上平臺。掃描以下二維碼或點擊本文左下角“閱讀原文”

演講實錄丨中科大陳小平教授《從封閉性到非封閉性：2020到2035年智能機器的機遇和挑戰》...

Nginx R31 doc 官方文檔-01-nginx 如何安裝

Qt/C++音視頻開發74-合併標籤圖形/生成yolo運算結果圖形/文字和圖形合併成一個/水印濾鏡

挑戰程序設計競賽 2.2章習題 POJ - 3617 Best Cow Line 貪心

字節面試：MySQL什麼時候鎖表？如何防止鎖表？

.NET8連接SQL SERVER 2008 R2 報：證書鏈是由不受信任的頒發機構頒發的

golang開發環境搭建(win10)

python計算機視覺學習筆記——PIL庫的用法

Centos7安裝/卸載RabbitMQ

今天想感謝一個夥伴

DolphinDB應用場景概述

【Python 3 選擇排序】

公開！阿里新產Spring Security筆記，這也太細了

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結