机器学习-西洋跳棋

原創

2018-09-12 05:14

Tesanro1992.1995设计了世界上最好的西洋双陆棋程序TD-GAMMON,它是通过一百万次以上与自己对弈来学习起策略的，现在他的水平能与人类的世界冠军相比。此程序使用人工神经元网络表示学到的评估函数，考虑对棋局的完整描述，而不是棋盘的几个参数。

西洋跳棋学习问题：

任务 T ：下西洋跳棋

性能标准 P ：比赛中击败对手的百分比

训练经验 E：和自己对弈

注：实际上，学习的样例通常与最终系统被评估时的样例又一定差异。

算法在机器学习中的实际应用：

可以只简单地存储训练样例，然后对寻找保存的“最接近的”情形来匹配新的情况（最临近算法）。

可以产生大量候选的西洋跳棋程序，并让他们相互比赛，保留最成功的程序并进一步用模拟进化的方式培育或变异它们（遗传算法）。

分析或向自己解释比赛中碰到的某一次成败的原因（基于解释的学习）。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.