每日有書: 終極算法


——· 關於本書 ·——

《終極算法》告訴我們,超級算法是一種可以將過去、現在、未來的所有數據轉化爲知識的規則,神經科學、進化論、統計學這三大領域都有令人信服的證據能夠證明超級算法的存在。此外,終極算法的世界,會同時存在兩個我,一個是“實我”,一個是“虛我”,他們互相分工合作,共同描繪人生畫卷。

——· 關於作者 ·——

作者佩德羅•多明戈斯,美國華盛頓大學計算機科學教授,國際機器學會聯合創始人,機器學習與數據挖掘方面的領軍人物,榮獲數據科學領域的最高獎項——SIGKDD創新大獎。《終極算法》被稱爲近20年來人工智能領域最轟動的著作,作者佩德羅用精準而淺顯易懂的語言闡釋了機器學習背後的思想源泉,如果你要了解人工智能將如何改變我們的生活,這本書就足夠了。

——· 本書金句 ·——

1. 所有知識,無論是過去的、現在的還是未來的,都有可能通過單個通用學習算法來從數據中獲得。我將該學習算法稱爲“終極算法”。

2. 機器學習算法的首要任務就是區別可預測的事與不可預測的事,但終極算法的目標是要學習一切能認知的東西。

3. 學習算法並不是完美的,決定的最後一步通常還得由人來做,但學習算法很智能,爲人們減少了需要做的選擇。

4. 未來屬於那些深深懂得如何將自己的獨特專長與算法的擅長結合起來的人。

——· 核心內容 ·——

一、終極算法的概念

1. 什麼是終極算法?

現階段,機器學習由很多種算法來實現部分所需的功能,比如,樸素貝葉斯算法可以用來診斷癌症和分類垃圾郵件,最近鄰算法可用於人臉識別和內容個性化推薦等。也就是說,機器學習存在很多算法,每一種算法可以實現一種或多種功能。這裏就出現一個疑問,既然一種算法可以完成多項任務,那麼,有沒有一種可能的情況是,有一種算法可以處理世界上所有的事情、解決所有的問題呢?

作者爲此做出了一個大膽假設,即所有知識,無論是過去的、現在的還是未來的,都有可能通過單個通用學習算法來從數據中獲得,這種學習算法被稱爲超級算法。簡單來說,只要能提供充分的、合理的數據,超級算法就能將其變爲相應的知識:輸入天體運行觀測數據,它就能發現物理定律;輸入DNA結構數據,它就能解密遺傳信息;輸入情感需求,它就能寫出動情的詩歌、小說乃至電影作品。

2. 終極算法必然存在的原因有哪些?

很多人對計算機可以自主學習這件事兒持懷疑態度,超級算法的強大功能更是被認爲遙不可及。但實際上,種種證據表明,現代科學在很多領域都預示了超級算法在不久的將來就會出現。

首先看來自神經科學的證明。神經學家將雪貂的視覺神經連接到聽覺大腦皮層上,然後聽覺大腦皮層出現了視網膜圖像。可見,大腦皮層自始至終只使用了一種學習算法,那些負責不同知覺的區域,區別也僅僅在於與其相連、輸入信息的器官不同。

其次看來自進化論的證明。著名計算機先驅查爾斯•巴貝奇說過,上帝創造的不是物種,而是創造物種的算法。進化論就是一種超級算法,只要輸入一定量的遺傳數據,在其與環境規則的互動中,在求生本能的推動下,不斷實現種族的延續和擴張。

最後看來自統計學的證明。貝葉斯定理,常常是統計學派用於機器學習的理論方法。貝葉斯定理的運行邏輯十分簡單,即使用“後驗”更新“先驗”。“先驗-修正-後驗”,如此簡潔的循環過程中創建新知識,貝葉斯定理一定會成爲推動終極算法的重要發展力量。

二、機器學習的五大學派

1.符號學派

符號學派的核心理念是邏輯推理,它認爲所有信息都可以簡化爲操作符號,新知識的產生,都是建立在已經存在知識的基礎上,通過邏輯推理從而獲得。

2.聯結學派

聯結學派的核心理念是神經網絡,它認爲所有知識都是通過神經元之間的聯繫而儲存起來的。聯結學派就是通過模仿神經網絡學習過程來探尋終極算法的。

3.進化學派

進化學派的核心理念是遺傳程序,它認爲所有形式的學習都源於自然選擇,攜帶遺傳信息的染色體在分裂交叉過程中創造出多樣化的物種以供自然選擇。進化學派是通過模仿基因遺傳過程來探尋終極算法的。

4.貝葉斯學派

貝葉斯學派的核心理念是概率推理,它最關注的問題是如何從不確定信息中發現新知識。通過對各種情況可能出現的概率大小進行綜合評估,從而發現新知識。貝葉斯學派正是通過概率推理過程來探尋終極算法的。

5.類推學派

類推學派的核心理念是相似性判斷,它認爲知識學習的關鍵是要找到事物的相似性。類推學派正是通過尋找事物間的相似性這一路徑來探尋終極算法的。

三、終極算法的影響

1. 終極算法是如何改變我們的?

在終極算法的世界裏,我的程序就是另一個我。未來社會中,會出現兩個我,一個是在現實生活中的我,我們稱之爲“實我”,主要負責體驗和決策;另一個是在虛擬生活中的我,我們稱之爲“虛我”,主要負責探索和預測。當面對問題時,在“實我”做任何決策之前,“虛我”都會提前完成信息收集、加工、分析和預測整個過程,充分發揮潛能,爲“實我”提供最好的選擇方案。

2. 爲什麼說數據公開是未來社會的基石?

現代社會中,相信很多人都會談數據公開色變,認爲數據公開會造成信息泄露,對人身安全有嚴重的威脅。但未來社會中,大部分情況下是“虛我”與“虛我”之間的溝通聯繫,這就需要完全的、透明的“實我”信息進行充分交換,虛假的、片面的信息會讓這一切都變得毫無意義。比如,如果“實我”想換一個新工作,那麼“虛我”就去應聘市場中尋找合適的職位面試,因爲“虛我”具有“實我”所有的意識特徵,所以“虛我”完全能夠代表“實我”參加整個面試過程,由於面試公司也可以根據自己的需求創造一個“虛我”,所以,這場面試就是擁有特定目的和自主意識的虛擬程序之間的交流與博弈,這不僅節省了“實我”的時間,而且也提高了面試公司的工作效率,一舉多得。這就是建立在信息公開透明的基礎上的未來世界,沒有這一基礎,這個世界便無法正常運行。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章