如何理解區分"人工智能"、“機器學習”、“深度學習”三大巨星

都說教育要從娃娃抓起。學習新東西當然也要從基本概念抓起了,近兩年,人工智能的真的是火遍大街小巷,不過,“人工智能”也不是一人獨火,他還有兩個形影不離的隊友:“機器學習”與“深度學習”。這三個詞如同天團組合一般,出現在各種地方,有時甚至互爲化身。那麼問題來了,人工智能、機器學習、深度學習三者到底是什麼關係?它們之間有什麼聯繫與區別呢?

人工智能——爲機器賦予人的智能


1956年夏天,以麥卡錫(John McCarthy)、明斯基(Marvin Minsky)、羅切斯特(Nathaniel Rochester)和香農(Claude Shannon)等爲首的一批年輕科學家相聚達特茅斯,共同研究和探討用機器模擬智能的一系列有關問題(史稱“達特茅斯會議”)。在那次會議上,“人工智能”一詞被提出,也標誌着“人工智能”這門新興學科的正式誕生。這裏面的科學家我只認識香農,附上帥照。
香農本尊
當時的人工智能研究處於“推理期”,人們認爲只要能賦予機器邏輯推理的能力,機器就會具有智能。當時的研究的確取得了一定的成果,比如證明了不少數學定理,部分定理的證明方式甚至比數學家的更爲巧妙。

然而,人類的智能不僅來源於邏輯推理能力,也來源於大量經驗和知識。比方說假如我從未坐過飛機也從未給別人買過機票,當你問我明天飛北京的機票多少錢,我估計會懵逼,連查攜程都不知道,從而顯得不那麼“智能”,但其實我的推理能力並沒有掉線。從20世紀70年代開始,人工智能研究進入了“知識期”,人們希望在推理的基礎上,把各領域的知識總結起來告訴機器,讓它獲得智能。當時大量的專家系統(具有大量的專門知識與經驗的程序系統,可進行推理和判斷,模擬人類專家的決策過程)問世,在很多應用領域取得了不少成果。

但人們很快認識到,把知識總結起來教給機器是非常困難的(稱爲“知識工程瓶頸”),因爲人類的知識實在太多,還得把這些知識寫成機器能夠理解的形式。如果我們能夠只給機器一些相對原始的數據,然後讓機器自己去進行學習,那該多好。所以從20世紀80年代開始,機器學習這一技術路線逐漸主導了人工智能的研究,直到現在。

機器學習—— 一種實現人工智能的方法


機器學習可以理解爲機器從已知的經驗數據(樣本)中,通過某種特定的方法(算法),自己去尋找提煉(訓練/學習)出一些規律(模型);提煉出的規律就可以用來判斷一些未知的事情(預測)。

機器學習最基本的做法,是使用算法來解析數據、從中學習,然後對真實世界中的事件做出決策和預測。與傳統的爲解決特定任務、硬編碼的軟件程序不同,機器學習是用大量的數據來“訓練”,通過各種算法從數據中學習如何完成任務。

比如我們接觸了1w只單身汪(已知樣本),通過歸納總結與比較(算法)找出TA們身上一些共性特點,然後將這些共性特點作爲判斷單身汪的依據(模型),那麼下次遇到一個人(未知樣本),就可以判斷TA是不是單身了(預測)。

既然是從一堆已知的樣本中找規律,那麼找規律的方式以及找出的規律的形態就會因人而異,也就是算法與模型都可能會有所不同。所以,機器學習本身也是分爲不同流派的,每種流派都有它代表性的模型與算法。機器學習主要分爲符號主義學習(以決策樹模型與相關算法爲代表)、連接主義學習(以神經網絡模型與相關算法爲代表)與統計學習(以支持向量機與相關算法爲代表)。符號主義學習與連接主義學習在20世紀80年代至90年代中期非常流行,統計學習則從90年代中期開始迅速佔據舞臺。值得一提的是,爲判斷一個人是否爲單身汪而找出的一系列特徵規律其實就是一棵決策樹。

任何通過數據訓練的學習算法的相關研究都屬於機器學習,包括很多已經發展多年的技術,比如線性迴歸(Linear Regression)、K均值(K-means,基於原型的目標函數聚類方法)、決策樹(Decision Trees,運用概率分析的一種圖解法)、隨機森林(Random Forest,運用概率分析的一種圖解法)、PCA(Principal Component Analysis,主成分分析)、SVM(Support Vector Machine,支持向量機)以及ANN(Artificial Neural Networks,人工神經網絡)。

深度學習——一種實現機器學習的技術


進入21世紀之後,互聯網與移動互聯網的興起造成了數據量的爆發式增長,雲計算也使得計算能力大幅增強,同時神經網絡的相關算法也逐漸成熟,所以導致連接主義的代表——神經網絡捲土重來。再次歸來的神經網絡,往往擁有比原先更爲龐大的網絡層級結構,所以被稱爲“深度神經網絡”。由於有足夠的訓練數據和計算能力,深度神經網絡在很多(尤其是語音處理、自然語言處理、圖像處理等較爲複雜的)任務中取得了非常優異的性能。性能的突破促成了人工智能在語音識別、文本翻譯、人臉識別等一系列場景的應用,讓大家看到了新技術落地所帶來的經濟效益與想象空間,從而引起了人工智能的熱潮。

說了這麼多,下面用一幅圖來說明人工智能的技術流派類別與演變歷程。要注意的是,雖然人工智能的流派在不斷演變,但這並非說明過去的技術路線就被拋棄了。這更像是以實際應用爲導向的各領風騷——在一個時代,某種技術流派正好能夠較好地解決這個時代所需要去解決的實際產業問題,那麼自然就會流行。目前有很多不同的機器學習技術正應用於各自適合的場景,比如作爲統計學習代表的支持向量機,仍然是文本分類任務的首選技術。

三大巨星的成長史


發展歷史

故事的結尾


人工智能是一個大的概念,是研究如何使機器獲得智能的學科;機器學習是人工智能中的一個技術流派,通過從已知樣本中提煉規律來獲得判斷未知樣本的“智能”;深度學習則是機器學習的一種,它所學習出來的模型是深度神經網絡。深度學習使得機器學習能夠實現衆多的應用,並拓展了人工智能的領域範圍。
這裏寫圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章