阿爾法狗的困惑

阿爾法狗的困惑

20201121

阿爾法狗,不是一般的狗,也因此纔有了困惑,這種困惑不是阿爾法狗自己的困惑,而是我對阿爾法狗的困惑。

百度上說,阿爾法狗是一種圍棋程序,使用人工智能的方法,實現圍棋的對弈。目前總體來說有四代產品,在與人類的對戰中,第一代戰勝了樊麾,第二代戰勝了李世石,第三代戰勝了柯潔,第四代沒有與人類對戰,只是在經過了用了三天的自我訓練,就戰勝第二代的機器,又經過四十天的訓練,又戰勝了第三代的機器,至此,阿爾法狗不再進行任何對弈。

阿爾法狗的代際關係

前面說了,阿爾法狗有四個版本,我說是四個代際,雖然它們之間的間隔時間並不長,但是我覺得它們之間並不平等,有更深層的代際關係,換句話說,它們之間的差距很大。

代際之間的差距是根本的,不可改變的。

網上說第一代與第四代,在網絡代碼的版本上,經歷了V18到V60的發展,而其中的發展與迭代,不是輕描淡寫的,無關緊要的,是發生了質的變化。

就像其他的軟件一樣,低版本無論如何也無法達到以及實現高版本的水平,阿爾法狗也是如此,但是其中又有差異。一般軟件的差異是因爲構成的內容不同,而軟件的功能完全依靠這些內容。阿爾法狗的差異並不在於內容,而更多的在於算法,這種差異與以往的情況有些不同。

阿爾法狗的特點是深度學習,他更偏重的是學習的方法,而不是學習的內容,內容是方法的結果。

經過了幾代的演化,算法的框架還在,只是算法的細節發生的變化。就是這些變化,使得代際之間形成了鴻溝,無法逾越。

有些時候,時間會抹平差距,但是對於阿爾法狗的幾個版本,再長久的時間也無法抹平這種差距。

阿爾法狗的形狀

作爲一個軟件,是需要生存環境的,也就是所說的硬件,以此爲平臺,實現其功能。簡單的說,需要運算處理單元和緩衝存儲單元,也就是一系列主機,輸入設備,輸出設備,所有這些構成一個設備羣組。設備羣組組成單元的性能會影響程序的效率,但是對於最終的結果影響不大。構成四代阿爾法狗的設備羣組的性能差異不大,也就是說不是設備因素形成的代際差,關鍵因素還是不同的程序和算法。

阿爾法狗都有什麼

一般的軟件運行之後會有什麼,以兩種類型的軟件爲例,一種是遊戲軟件,一種是設計軟件。

遊戲軟件是預先設置場景和任務,如果有時間,有技巧,遊戲的運行過程是窮盡所有的內容,代價是消耗了時間,所謂的愉悅,只是一時的快感,而愉悅與快感是對於玩遊戲的人,而對於遊戲程序本身,沒有任何的改變,對於承載遊戲的設備,只是記錄了有些的過程。

另一方面,遊戲軟件可以在任何的滿足條件的設備上運行,而得到的體驗與結果是相同的。

設計軟件,就是一種工具,使用設計軟件的人,在軟件的運行過程中,對軟件沒有任何的影響和改變,只是通過設計軟件完成使用人的一些工作。使用人的熟練程度和設計能力,決定了使用之後的結果。

無論如何這兩種軟件的運行和使用,最終都不會對軟件有任何的影響,並且軟件也不會通過運行而發生任何的改變。

其實對於幾乎所有的軟件或許都是如此,只是阿爾法狗會是個例外。

阿爾法狗的運行,不受人的影響,運行的結果同時作爲程序的組成部分,進而改變程序的性能。另一個有趣的事實是,阿爾法狗的運行結果,即便是阿爾法狗的開發團隊,也是無法預知的,同時也無法干預,無法影響。

有一種不確切的想法,就是阿爾法狗程序無法實現,或說很難實現“人機分離”,換句話說,這個狗就是這個狗,不會是那個狗,如同人一樣,世界上不會有相同的兩個人,也不會有相同的兩個阿爾法狗。

阿爾法狗可以繁殖嗎

理論上思考這個問題,我認爲是可以繁殖的,如同人類的繁殖一樣,阿爾法狗的源代碼就像是一種遺傳基因,在適當的條件下,就可以生長成爲一條新的阿爾法狗,由於生長條件的差異,會形成差異化的存在。如果在程序上再增加變異化的啓動條件,出現新形式的個體,是完全可能的。

說到這裏,有一個不容忽略的事實,也或許是一種猜想,就是阿爾法狗的個體生存,嚴重的依賴於設備集羣,或許也可以說,設備集羣是阿爾法狗的載體,軀體,阿爾法狗本身是一種思想,靈魂,像人類的個體一樣,因此阿爾法狗不可能獨立的存在,並且一旦形成,就無法與設備分離,除非將其“殺死”。

阿爾法狗會“狗丁興旺”嗎

想象來看,可能性不大。

阿爾法狗要想獲得個體數量的增加,需要有幾個條件,簡單的說,一個是個體本身的限制,一個是需求的限制。

記得在計算機初始之時,按照現在說法,只是實現了一個很小的功能,卻有着龐大的需求,體積與電力供應,而改變發生在集成化與小型化之後,可以說從毫米級到納米級的進化,計算機的技術與工藝的發展,遠大於原理與邏輯的進步,如果說阿爾法狗的出現,使得這種進步出現了新的曙光,而現在的技術與工藝的極致發展,已經使其成爲一種限制與約束,此時,應該需要一種新的技術與手段,甚至理論,來與之相合。因此就目前狀況看,阿爾法狗不會有大的數量上的增加。

另一方面,對阿爾法狗的需求,也限制了其數量的增長。可以斷定的是,沒有人會需要一個這樣的阿爾法狗的,即便是圍棋愛好者,阿爾法狗帶給人們的只能是沮喪,沒有快樂。

阿爾法狗會覆盤嗎

這個問題或許不是一個問題。覆盤的作用是通過經驗來學習,而阿爾法狗的技術,已經不需要經驗了,也就是說覆盤對於阿爾法狗來說,沒有意義。

絕對的說,不會有相同的兩盤棋局的,但是在人類的對弈中,藉助棋譜,定式,可以減少一些思考,但是對於阿爾法狗來說,這一點毫無意義,經驗給阿爾法狗的只是價值判斷和趨勢判斷,這種判斷不依從於定式,也不依從於棋譜。

學習的內涵與作用

阿爾法狗的出現,打破了以往的一些認知常識,而其中最大的困惑,是關於學習的。

通過學習,人們獲得知識,而所謂學習是重複過去人們走過的,經歷的,是對過去的傳承,有時間和歷史的烙印。當然這裏說的學習的範疇有些寬泛,或有詞不達意的嫌疑,但是如果把這個範圍縮小到圍棋的範疇,應該更有說服力。

從認知圍棋,到學習圍棋,再到訓練圍棋,實戰圍棋,每一個涉足圍棋的人無一不是從書本,從道館,從學校,從老師,從師傅,開始的,然後還要自己鑽研,琢磨,打譜,從中體會和領悟圍棋的內涵,然後再去用於實踐,可以說這是一個標準的學習的過程。

然而阿爾法狗卻打破這樣一種流程。

在初期的阿爾法狗,的確也是遵循了這樣的一個流程,可是在第四代的阿爾法狗,也就是AlphaGo Zero,已經完全拋棄了這個流程,在沒有任何學習過程,只是在規則的約束下,通過完全的自我學習,就掌握了圍棋,並達到了一定的水平。三天之後,就戰勝了第二代,四十天之後,就戰勝了第三代,這是一種怎樣的情況,在如此短暫的時間裏,就把人類個體需要潛心修行很長時間的理論,技術,悉數掌握,有些讓人費解。

是圍棋理論故弄玄虛,還是阿爾法狗確有過人之處,不管怎樣,在第四代阿爾法狗面前,圍棋已經不再神祕,並且簡單到可以無需學習,只要自己體會,瞬時即可掌握的了,人類經過千百年建立起來的圍棋知識大廈,瞬間傾覆,在圍棋領域,人類徹底的失去了尊嚴。

那裏出了問題。

學習可以說是一種智力的遊戲,是爲那些高智商的人們準備的,就像體育競技,根本就沒有弱者舞臺,然而當人們還在沉迷於一種幻象的時候,人們還在向着更高的層級攀登的時候,阿爾法狗把一切都給削平了,推倒了。

勝負,是圍棋追求的終極目標,除此之外,在追逐的過程中,還附加了一些內容,構成了全部的圍棋文化,然而所有的這些文化,又在勝負面前變得一文不值,也就是說,只有勝負,纔是圍棋的精髓,而阿爾法狗確實深諳其道,心無旁騖。

人之所以爲人,其關鍵是因爲人的不純粹,人總要把原本簡單的事情,賦予更多的玄外之音,並構建複雜的結構,用以消耗人的過剩的精力。

從實用的角度上看,圍棋對於人類的生存,沒有一絲一毫的意義和用處,然而現在圍棋的確是一種知識。

圍棋知識是什麼樣的知識

或許可以把所謂的知識分成兩大類,一類是自然的知識,一類是人類的知識,圍棋的知識不是自然的,是人類的。

兩種類型知識的特點是什麼呢。自然的知識是一種天然的存在,不以人的意志爲轉移,就在那裏,如果這個世界不再是人的世界,變成了狗的世界,這類知識依然存在,不生不滅。人的知識是人創造出來的,只作用於人自身,是一種違背自然的,無用的,用於消耗和管理人的一些東西,圍棋就屬於這一類。

阿爾法狗及其所包含的一切,都是在人的知識範疇內,它似乎掌握其中的精髓和奧祕,但是對於自然的知識,目前還沒有像在圍棋領域裏的作爲,或許這也是阿爾法狗的一種侷限性。

就好比有一句土語,叫“窩裏橫”,或許該有這個意思。

知識灌輸能夠成爲現實嗎

我曾經有一個夢想,就是不再要費時費力去學習,就像科幻電影那樣,把一些知識和記憶,通過一種手段,一下子就輸入到我的系統之中,使我瞬間掌握必須的知識和技能,現在看來,有些或許是可行的,有些或許就不行,比如下圍棋。

下圍棋作爲雅事而被推崇,然而要想獲得這樣一種技能卻絕非易事,或許會有一些祕籍,可以在短時間內學習和掌握圍棋的精髓,阿爾法狗有可能帶給我希望,然而事實絕非如此,似乎並沒有祕籍,只有苦行,而苦行的結果也是無法共享的。

也許可以這樣認爲,阿爾法狗的確找到了一種對弈圍棋的方法,但是這種方法只適用於阿爾法狗,並不適用於人類。再或許阿爾法狗也只是建造了另一種黑箱而已。

關於阿爾法狗的困惑應該遠不止這些,只是在獲得一些皮毛的信息之後的一些想法,真實的信息遠不止這些,而給人瞎想與衝擊的內容還要更多。似乎這件事已經過去了,應該不會,這只是一個開始。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章