原创 翻譯Deep Learning and the Game of Go(15)第13章   AlphaGo:把這一切都彙集在一起

第三部分 大於部分之和         此時,您已經學習了許多人工智能技術,這些技術來自經典的樹搜索、機器學習和強化學習。每一個都是強大的,但每一個都有侷限性。要做一個真正強大的圍棋AI,你需要結合你到目前爲止學到的一切。整合所有這些部件

原创 翻譯Deep Learning and the Game of Go(14)第十二章 採用actor-critic方法的強化學習

本章包括: 利用優勢使強化學習更有效率 用actor-critic方法來實現自我提升AI 設計和訓練Keras的多輸出神經網絡 如果你正在學習下圍棋,最好的改進方法之一是讓一個水平更高的棋手給你覆盤。有時候,最有用的反饋只是指出你在哪裏贏