机器学习-西洋跳棋

       Tesanro1992.1995设计了世界上最好的西洋双陆棋程序TD-GAMMON,它是通过一百万次以上与自己对弈来学习起策略的,现在他的水平能与人类的世界冠军相比。此程序使用人工神经元网络表示学到的评估函数,考虑对棋局的完整描述,而不是棋盘的几个参数。
       
              西洋跳棋学习问题:
       任务 T :下西洋跳棋
       性能标准 P :比赛中击败对手的百分比
       训练经验 E:和自己对弈
       
         注:实际上,学习的样例通常与最终系统被评估时的样例又一定差异。
     
              算法在机器学习中的实际应用:
        可以只简单地存储训练样例,然后对寻找保存的“最接近的”情形来匹配新的情况(最临近算法)。
        可以产生大量候选的西洋跳棋程序,并让他们相互比赛,保留最成功的程序并进一步用模拟进化的方式培育或变异它们(遗传算法)。
       分析或向自己解释比赛中碰到的某一次成败的原因(基于解释的学习)。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章