北大AI講座公開課-精華

最近在觀看北大AI講座公開課,覺得受益良多,稍做筆記。

觀看地址如下:

https://c.m.163.com/news/s/S1521443845851.html

小技巧:上面鏈接是移動端觀看方式。如果電腦端觀看網址模式爲http://live.163.com/room/xxx.html。點擊合集網站獲取每個視頻的標籤碼,然後將根據標籤進入相關網址,如http://live.163.com/room/173117.html 中的173117即爲標籤。

附清華AI公開課的鏈接:https://c.m.163.com/news/s/S1521539942968.html

北大第一課:人工智能前沿產業趨勢

 

    第一課是由雷鳴老師主講。

 

    開篇就提到了AI需要“做一個有用的東西”,所謂“有用”,就是要比人類現有的處理方式產生優勢。比如:如果自動駕駛每百萬公里的事故率低於人類駕駛,那麼這項技術就因此而有用。隨着深度學習算法、計算能力以及數據量三方面的發展,機器在圖像識別(人臉識別、醫學影像)、語音識別(翻譯盒子)等方面已經超過人類,未來可以預期有更多的領域將會成爲AI發展的土壤。

    勞動可以按照需要的腦力水平分爲體力勞動(如:耕作)、技能勞動(如:駕駛、機械製造、售貨服務)和創新勞動(如:芯片設計、算法設計)。回顧人類歷史,勞動者在單位時間內的生產力水平在工業革命之前並沒有顯著提升,而在工業革命之後的二百年時間裏成指數上升。這是因爲工業革命後,機器取代了人類的體力勞動,農業社會轉變爲工業社會。展望未來,隨着智能時代的推進,更多的技能勞動將被機器取代,由工業社會轉向智能社會。

    目前來講,智能化還集中在低技能、高數據、高經濟效益的領域;從趨勢上看,在向高技能、低數據、普通行業發展。

北大第二課:AI在金融領域的應用及趨勢
    本課由螞蟻金服的漆遠主講,漆遠博士畢業於MIT,是普渡大學的終身教師。開篇說了句幽默而反應當下社會的話:“如果現在還有人工智能解決不了的,那就上區塊鏈吧!”

    漆遠給大家帶來了人工智能在螞蟻金服中的應用,主要是金融智能大腦(主要用於風控和借貸)。其開發的智能包括雲端智能和agent端智能。在智能安全方面,有系統安全檢測(弱監督學習)、反洗錢模型(無監督、基於網絡)、垃圾賬戶識別(根據人與社會的關聯形成網絡、涉及表示學習範疇的struc2vec模型);在智能營銷方面,有多次觸達序列強化學習營銷(深度強化學習)、information fusion和multi-view learning(發現了 skinny jeans->手機碎屏服務的關聯規則)、保險應用(定損寶:部件識別、去反光);在智能助理方面,有客服機器人(當年自助比94%)、Antone(迭代成長的對話機器人)。

    金融智能平臺需要非常快地處理海量數據,重要的是安全、實時和大規模,從底層的GPU、FPGA、CPU、ASIC,到中間層的金融級超大規模異構計算,再到上層的強化學習、深度學習、無監督學習和圖推理。金融智能平臺在“芝麻分”中應用,可以將建模效率從1月提升至1周,將部署從2周提升至1小時,信用KS值提升10%。將科學決策機制AB測試用在金融服務中,用測試流量來分析因果關係(發現小紅點作爲提示符更好,去掉腰封之後的網頁點擊率更高,這是與設計者初衷相悖的),體現用戶反饋在系統中的重要性。

北大第三課:視覺計算的變革和挑戰

 

    本課由Face++的孫劍主講,主要內容爲計算機視覺方面的基本概念及發展脈絡,以知識普及爲主。

 

    計算機視覺按照任務種類可以分爲分類(貓狗)、檢測(框出)和分割(像素級)。神經網絡的方法在上世紀50年代就有人研究,但由於神經網絡模型難以訓練,而SVM等傳統方法效果和理論基礎都比較好,神經網絡的方法沒有獲得足夠的發展空間。2012年,hinton等人BP算法應用到CNN模型中,使得神經網絡的訓練和優化變得簡單。隨後的幾年中,在imagenet測評的推動下,VGG、GoogleNet、ResNet等模型被提出,模型層數越來越深。

    在這場科技變革中,Face++引領人臉識別領域的發展,做了很多優秀的應用。着力於解決深度學習在計算機視覺中的優化問題,增強其解釋性、可訓練性和普適性。孫劍團隊憑着深厚的學術積累,與2013年的R-CNN直到2017年的Mask R-CNN中都有着直接或間接的關係。Face++目前在嵌入式智能設備(ShuffleNet 低計算複雜度計算)、人工智能平臺取得了優秀成果。


北大第四課:人工智能如何釋放數據原力
    本課由來自Intel公司的宋繼強老師主講,重點講解芯片技術對於智能時代的推動。

 

    在過去的一段時間裏,AI主要由大公司在B端(企業端)進行革新,更重視系統能力;而將來會更多地接近C端(消費者),更重視個人以及系統成本。從2005年至今的13年時間裏,我們處於CT(計算機技術)時代,而在不遠的將來,我們將進入RT(機器人技術)時代。機器人並不是長得像人的機器,而是代替人工作的機器,比如:掃地機器人就是一個小圓盤、個人助理就是一個音箱、炒菜機器人就是一口鍋……當機器人像手機一樣變成剛性需求的時候,就是RT時代的降臨。

 

    Intel在人工智能時代的最大貢獻莫過於在其主導下摩爾定律保持了53年之久(1965年至2018年),使得AI的浪潮成爲可能。CPU、GPU、FPGA、衆核處理器、ASIC(如:Google的TPU)等多種芯片的發展使得計算能力提高、成本降低。根據應用場景,選擇能效比和適應性符合要求的芯片,是各公司考慮的問題。Intel近期推出了LOIHI類腦計算芯片,正在開發配套軟件和應用場景。

 

北大第五課:陳雲霽——深度學習處理器

    本次課程由寒武紀創始人之一的陳雲霽主講,他跟弟弟陳天石均是科大少年班出身,共同創建了寒武紀公司,目前也都是中科院計算所的研究員。

    課程開始回顧了人工智能的發展脈絡,闡述了由符號主義到行爲主義,再到連接主義的進程。將人工神經網絡的興起歸結爲連接主義中的成果,同時也將人工神經網絡與生物神經網絡的關係比喻爲老鼠與米老鼠的關係,表明了當前人工神經網絡的一些不足和固有困境。課程指出,增強學習+深度學習的框架是當前人工智能領域的一大革新。Google使用10億英鎊收購當時初露頭角的DeepMind,體現出其智慧與對未來的感知。

    陳雲霽的研究生方向爲芯片設計,而陳天石研究深度學習算法,他倆聯合起來就進行了專用神經網絡處理器的研究。從2008年開始研究相關技術以來,在國際上的很多會議上獲得最佳論文(12-16年間成果頗豐),目前寒武紀的芯片已經在華爲手機中加速,提升手機中的神經網絡運算速度。其主要解決的三個科學問題包括:①有限規模的硬件VS無限規模的算法(基本運算元時分複用、各種方法降低數據搬運成本);②結構固定的硬件VS千變萬化的算法(創造智能指令集,搜索幾百種算法並從中歸納出幾算法共性);③能耗受限的硬件(手機<=1w,服務器<=300w)VS精度優先的算法(採用稀疏化算法,將權重較小的神經元稀疏掉)。

    陳自豪地說,相關領域高引論文前十位有一半來自其團隊,“一直被跟隨,從未被超越”,2018年的science報道表明了其先驅地位。但願中國能夠產生更多地領先世界的團隊、公司和領域。

 

北大第六課:自動駕駛與人工智能

 

    本次課程由百度的陳競凱講解自動駕駛方面的知識,從自動駕駛的歷史、分級、目標和系統組成部分展開。自動駕駛早在1925年就開始被研究,1939年的未來城市計劃更是明確表示了自動駕駛的願望,因此很多歷史悠久的公司對於自動駕駛有着深厚的積累。根據智能化程度,自動駕駛可以分爲L0-L5六個等級:L0,警報;L1,自動控制油門或者剎車;L2控制方向盤,但需要人時刻注意;L3,人可以部分時間脫離注意力,目前奧迪A8等車型宣稱具備L3;L4,在限定場景自動駕駛,比如F1賽場中;L5,在不限定的場景下自動駕駛,是無限逼近的終極目標。

 

北大第八課:自然語言對話:現狀和未來

    本次課程由李航老師主講,題爲“Natural Language Dialogue: Present and Future”。課程由智能機器的定義展開,認爲智能計算機有4種可能的定義:Thinking humanly, Acting humanly, Thinking rationally, Acting rationally。從功能角度來看,理解包括兩個層面:表示和行動。

    對於自然語言,理解的層面包括:Lexion、Syntax、Semantic(即詞法、句法和語義)。在腦科學領域,科學家發現人腦的布洛卡區對應句法、韋尼克區對應詞彙。對於語義的理解,在概念的形成過程中,每個人有共性也有個性。如“flying pig”,人們對於pig的具象化理解大致相似,但對於flying的具體方式(是否使用翅膀?)會有區別。另一個很大的挑戰是“ambiguity and variablility”,人是有world knowledge和語言習慣作爲背景知識的,而計算機會被多義性困擾。

    本課主題爲自然語言對話,具體分爲單輪對話和多輪對話。單輪對話的形式包括基於分析、基於檢索和基於生成。多輪對話要基於有限狀態機和知識庫。

    最後,李航老師給出了幾個比較重要的課題:semantic grounding、neural symbolic processing、deep reinforcement learning、 modular and hierarchical processing、meta learning (learning to learn, few-shot learning)。

北大第九課:人工智能在視頻中的應用

    本節課由奇虎360公司副總裁顏水成老師爲大家帶來人工智能在現實生活和安全領域的應用。

    AI工程化:場景、算法、算力、數據

    做AI工程需要考慮的問題:高頻剛需、技術成熟、貿易壁壘、變現途經(講座非常之精彩,其中意蘊需要細細領會)

 

北大第十一課:語言智能的進展
    本節課由來自微軟亞研院的周明老師爲大家帶來關於自然語言處理(NLP)的講座,對自然語言現階段的狀況和進展作出了一些闡述。
    人工智能的三要素包括:數據、算法與框架、計算能力。如果做出的應用有落地場景,能夠接收用戶反饋,那麼就有機會作出更好的產品或應用。
    智能可以分爲下面幾個層次,有底層到高層分別是:運算智能(計算)、感知智能(聽、視覺)、認知智能(語言和推理)、創造智能(想法、理論)。運算智能指的是計算機的運算和存儲能力;感知智能指的是計算機能夠接收外界傳入的信號,能有辨別能力;認知智能與語言智能緊密相連,要求對問題有理解和推理的能力;創造智能要求計算機產生新的事物、想法或意識(對聯、作曲、唱歌等)。
    微軟亞研院在神經機器翻譯、聊天機器人、機器閱讀理解、創作機器人等方面都有很強的科研實力。其中有很多理論和實踐方面的創新,如:對偶學習(機器利用自己產生的數據來加強訓練,中英翻譯 中->英->中 兩個中文句子間差距越小表示性能越好)。

    周明副院長表示,自然語言理解在未來5-10年內將發揮巨大作用。例如,智能客服能夠解決30%-50%的問題,google assistance已經能夠幫助人類處理簡單的日常事務。

 

北大第十四課:AI工程實踐與人才成長路徑

    本節課程由創新工場的王詠剛老師主講,主要是概念上的指導,包含少量技術上的內容。他指出,從學校裏培養出來的科學型人才與AI市場需要的工程型人才有一定的鴻溝,需要通過工程項目的實踐才能成長起來。下面將其講解的具體內容做一些整合。

    目前市場上的很多獨角獸公司採取B2B、B2G模式,發展很好。阿里提出的新零售概念也已經漸漸步入生活(比如:原麥山丘麪包店裏的自動識別付費系統)。從學科教學到工程實踐有很多需要彌補的空缺,科學中的算法只是工程中的一小部分。比如說,麪包識別系統的燈光會隨着適用場合、使用年限產生不穩定的波動,而且麪包重疊情況下的提示和識別也是必須要考慮的問題。能力建設有三個視角:個人發展、學術環境、產業環境。工業界與學術界在關注重心上有所差別。

    接下來是一些技術上的探討。作爲一個AI工程師,需要知道深度學習不同場景下應該使用的芯片技術(GPU?TPU?雲服務器?),模型應該寫成多大(模型壓縮),是否使用邊緣計算(每個節點有一些計算能力,將初步處理得到的數據與控制節點進行交換),編程語言的使用(C、C++、Java、Python甚至是LISP),編程代碼的規範(Google Style Guide),深度學習框架的選擇(tensorflow、pytorch、keras、DL4J、caffe)。

 

清華演講 人工智能:未來已來,隱約可見

    商湯科技CEO徐立幽默風趣地向同學們展示了他對於科技和未來的思考。通過展現商湯科技在圖像理解方面的成就,闡釋了人工智能在當下的應用。

    目前人工智能是作爲生產力的工具,在不同的領域中的發展有這樣的階段共性:第一階段,技不如人,只能作爲artificial label;第二階段,超越大衆,可以作爲人工的輔助;第三階段,超越專家,實現技術的突破,形成人對機器的依賴。商湯科技使用自主研發的深度學習平臺,採用超深的網絡、超大的數據學習、複雜的關聯應用,作爲其核心技術。在應用層級上,視覺計算不僅可以進行low level成像和感知,還可以進行high level的識別和理解,機器已經可以創作、可以將模糊的圖像還原精細,在這些限定領域,機器超越人類指日可待。

清華第四課:人工智能與量子計算

    本課由施堯耘和段路明主講。

    施堯耘是阿里雲量子技術首席科學家,他的講演深入淺出,爲我們概況性地闡述了量子計算及其在人工智能中的應用。量子計算方面的概念包括:量子比特(帶有複數權重的線性組合),量子操作(保持長度的線性變換,在不同場景下被稱作酉變換或正交變換),讀取(投影測量,平方和爲1)。由於量子比特的權重可以爲負,量子算法中的錯誤不會線性累加(positive&negative weights may cancel out)。量子計算的驅動力:物理模擬、破解密碼、AI/大數據。在AI中,量子計算可以加速AI常用算法:解線性方程、解常微分方程、SVM、Data Fitting。量子模型:Quantum PAC Learning。量子處理器-> 量子軟件->  量子算法->  應用,最後喊出了口號:量子計算終將實現。

    段路明是清華大學姚期智講座教授,是清華大學量子信息中心的教授。其口音較重,但說話很準確。他更多地從物理角度解釋量子計算。他表示量子計算機提供自動並行,量子計算硬件與量子學習算法結合提供指數加速。作爲資深科學家,他將近期量子計算機的實現分爲幾個發展階段——階段一(目前階段):2-20個量子比特,邏輯門保真度95%-99%;階段二(Logic qubit/ Quantum supremacy, 下5年):30-100個量子比特,在特定問題上超過最強經典計算機;階段三(量子革命,大約15年):廣泛影響各個領域。

清華第六課:落地的人工智能

    本課開始時,雷鳴老師給我們列舉了幾個人工智能落地比較有前景的行業:智能助理、遊戲及娛樂、智能製造、智能農業。

    楊強是香港科技大學教授、IJCAI理事會主席、華爲諾亞方舟實驗室主任。他講述了人工智能的層級和實例。從層級來說,包括感知、機器學習、推理和抽象遷移。目前感知已經做得很好,而機器學習技術也在大規模應用,推理技術還不成熟,抽象遷移更加困難。一個AI,兩種模式:專用VS通用、輔助VS自動、交互VS核心;不同的學者給AI的角色和定位有所區別,目前來說專用和輔助是更加普遍的觀點。測試方法(evaluation)很重要,它決定了是否可以採用AI,使用AI的效果會怎麼樣。AI落地,需要:目標明確、數據切合要解決的問題、跨界人才(需要領域內知識)。AI in all是不合適的,更準確的是AI in some。例如:Watson希望在癌症醫療領域有所作爲,但是無法獲得足夠量的需要的數據,因此這種嘗試沒有成功。

【本博客隨課程更新中...】

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章