深度學習tensorflow----初步說說阿法狗

         真的讓人工智能火起來的事件就是李世石和阿法狗對戰了。最後結果是阿法狗勝利。後來柯潔也去對戰了,也輸了。結果不說了。我就順便描述一下,阿法狗吧。

         第一版的阿法狗,是通過學習人類的棋譜,學了很多之後,它就大概知道人會怎麼下去了。簡單的說法就是因爲它已經學會了人類的一些優秀的棋譜了,記在大腦裏面。之後,你在下棋的時候,它就對照之前人類的棋譜,找到最合適的下法。屬於人類裏面的集大成者,而且它不會忘記,不會出錯。但是人類不一樣,總是會忘記。必定阿法狗是學習人類遺留下來的棋譜,那麼如果人類棋手下了一些之前沒有的怪招,就很可能照成阿法狗的出錯。

         到了第二版本的阿法狗,就不需要人類棋譜了。而且能力更強了。爲何呢??

         人在學習的時候,是有路徑依賴的。都是通過其他人的記錄和方法去學習的。而且人對推理思考的距離是有限的,也就只能思考3--5步而已。按照數學的說法是,僅僅是當前局勢情況下,3--5步以內的最優解,而且有可能是局部最優解。人和人之間的博弈,是沒有辦法去找到20--30步以內的最優解的。而阿法狗不一樣,它在自我博弈的時候,它不會侷限3--5步以內的最優解。所以,在後來的柯潔對弈中,表現出來的下棋方法就更沒辦法讓人理解了。脫離了人類下棋的軌跡。

          

         

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章