DeepMind是如何重塑国际象棋之美的?

全文共3619字,预计学习时长11分钟

1707ac8a69868d11?w=640&h=424&f=jpeg&s=15711uploading.4e448015.gif转存失败重新上传取消

来源:Pexels

 

职业斯诺克台球是一种和弹子球类似的游戏,这个游戏风靡英国的同时,人们对游戏中的“战术”一词始终迷惑不解。

 

一般来讲,在斯诺克台球里有两种等分球,一种是可直接得分的入袋球,另一种是可以为对方制造障碍的安全球。在斯诺克规则下,一场比赛可能会陷入旷日持久的安全对垒,并不仅针对较为随意的玩家,比赛双方都不想把球装进自己的口袋。有些人把这种游戏模式称为“战术型”。其实这种说法是错的。最合适的词语应该是“策略型”。

 

职业国际象棋并非浪得虚名,国际象棋中战术和战略的区别曾被奥地利出生的特级大师萨维利•塔尔塔科沃(SaviellyTartakower)描述为:国际象棋国际象棋“有目标时你有的是战术,没目标时你有的是策略”,他的解释耐人寻味。

 

这二者的区别对理解(或者不如说欣赏)最近突然兴起的国际象棋热来说至关重要。去年,一个名为AlphaZero的程序和另一个程序Stockfish 8竞争,在技术层面上,AlphaZero一骑绝尘,把Stockfish 8远远抛在身后。这场对决在计算机,人力,智能以及未来发展方面都值得探讨,也许,在艺术和审美方面,我们也能有些意外的收获。

 

那么,什么是国际象棋之美呢?

我想试着解释这个概念,毕竟在我写第一本书《国际象棋大师》时我就已经开始研究这个问题了。简单来说,国际象棋是有法可依的,这个法就是指游戏的规则,国际象棋里也有一些取胜的套路。国际象棋之美就在于玩家往往能够另辟蹊径,险中取胜。

 

这种劫后余生的欣喜必然会让玩家们体会到国际象棋这一艺术的博大精深。

 

就国际象棋中的骑士而言,通过L型移动,位于棋盘中间的骑士可以控制或攻击八格棋盘,而相反,位于角落的骑士的只能攻击两格。因此,客观来讲,位于棋盘中间的骑士比位于角落的骑士增加了四倍的杀伤力。

 

因此,正如波兰国际象棋大师西格贝特·塔拉施所言:边马为弃马。但是如果你执意要把你的骑士移动到角落的位置,而恰好就是因为这一招让你最终成功取胜,那么,这就是国际象棋的迷人之处了,这种劫后余生的欣喜必然会让玩家们体会到国际象棋这一艺术的博大精深。

 

几年前,人工智能公司DeepMind开始用游戏挑战人脑。他们认为如果能开发一套能够进行自我教学的系统,以排除人脑计算的误差偏见和先入为主的影响,那么它“自己就能赋予自己智力并且运用这种智力解决其他问题”。这种想法很快在亚洲围棋上得以实现,然后又在国际象棋上开展了应用范围更广的实验,国际象棋。

 

来源:Pexels

 

2016年,DeepMind研发的这套程序成功打败了世界顶级围棋棋手,来自韩国的李世石。下一个目标就是国际象棋,尽管此次不再是人机对战。当前目标是要打败世界顶尖的电脑程序,也称“国际象棋引擎”,该程序已经经过了数十年的进化升级。

 

在继续讲电脑程序之前,我们需先追溯象棋的历史,回到战术和策略上来。国际象棋的规则并不死板,不属于硬性规定,但人们普遍认为,无论是对玩家还是一旁的观棋者来说,战术棋类游戏会更有趣,比如棋子交换、“对赌”或牺牲棋子、配合攻击和“狩猎国王”。这之中的美学意趣取决于棋手的战术。相比之下,战略型游戏的理论优势在30或40步以内就已成定局,看起来毫无意义。历史上,这种风格的球员有古巴世界冠军何塞·劳尔·卡巴布兰卡和俄罗斯世界冠军米哈伊尔·博特文尼克,他们被嘲讽为一群冷冰冰的机器人。

 

这就是奇怪之处,因为事实证明策略型游戏比战术型游戏更有“人情味”。

 

或者我们看到的只是表象。随着国际象棋程序不断升级,人们认为战术是创造性的,且依赖于直觉。一台冷冰冰的机器或许能够依靠策略完成一场像样的比赛,但它永远无法与一个能够带来更深刻的战术创造力和拥有独创性的人类玩家竞争。然而,当这些电脑程序最终获得足够强大的计算能力时,人们发现制定策略其实非常简单。只要计算能力足够深入和强大,计算机可以很容易地“看出”任何可以隐藏花哨的战术的地方。事实上,战术毫无创意可言。事实证明,在一段不长的时期内,人类玩家可以设法保持与国际象棋程序势均力敌,因为依靠策略思维,他们有时可以凭直觉地深入到比引擎计算更深的位置。

 

本质上,国际象棋程序是人类玩家的完美版本。正如1997年击败俄罗斯世界冠军加里·卡斯帕罗夫的“深蓝”程序,强悍的国际象棋程序结合了计算能力、此前出现的国际象棋游戏的综合资料库和权威国际象棋智慧百科全书(边马即弃马)。而它的弱点是,国际象棋程序终究也只是个程序。也就是说,如果编写代码的人对国际象棋的理解存在有缺陷或错误的假设,那么这个引擎也就存在了同样的bug。

 

无论如何,国际象棋程序很快就会轻松击败世界顶级大师。不仅如此,这些程序与人或其他引擎之间的对战,会让观众们感到既冷酷又呆板。战术容易被驳倒,所以比赛变得更富策略性,也更沉闷。国际象棋界担心这个已有几百年历史的博弈游戏已被破解。“不可玩”成了一个术语,用来形容远远超出理解的情况,你所能做的也就是耸耸肩。看起来这个游戏已经失去了活力。

 

当DeepMind开发AlphaZero时,它完全不具备国际象棋的高级知识。没有记录已公开的招式。没有像“深蓝”那样,包含了一部汇聚了人类一千多年的博弈历程的国际象棋智慧百科全书,它只是记录了游戏规则。

 

9个小时内,AlphaZero以每秒超过1000次的速度,进行了4400万次博弈,,以学习如何对弈。之后它与Stockfish8竞争。2017年底向公众发布了10场比赛,2018年年初又发布了数十场比赛。从那以后,国际象棋进入了新世界。

 

互联网以无数种方式改变了国际象棋,其中一个重要的变化是,越来越多的国际象棋玩家自己制作视频来讨论国际象棋,讲述一些经典招式的前世今生,或者最近几次的比赛。推特上的英国博主kingscrusher上传了9000多个视频,吸引了10.4万粉丝;克罗地亚YouTuber agadmator吸粉50万,视频点击近 10亿次。

 

最令人兴奋的是AlphaZero的战术。它牺牲了兵和棋子,把主教和皇后搬到了棋盘的角落。它以人类玩家从未考虑过的方式冒险。

 

以上博主和许多其他评论员制作了大量分析AlphaZeroVS Stockfish 8游戏的视频。这些视频最有趣的地方在于,分析人士对AlphaZero的游戏风格有着无限的热情。有时,AlphaZero的举动会让他们感到困惑不解,但也会让他们着迷。他们的反应就好像他们面对的是一部代表着突破、飞跃的艺术家的作品。

 

最令人兴奋的是AlphaZero的战术。它牺牲了兵和棋子,把主教和皇后搬到了棋盘的角落。它以人类玩家从未考虑过的方式冒险。这次冒险意义深远。首先,国际象棋界又错了——这次是第一回合就错了。战术打法确实是下棋的最好方法。第二,一千多年来的流传的那些所谓必胜法则还远远不够——或者换句话说,AlphaZero证明,那些被视为坚如磐石的法则现在可以被轻而易举地推翻。

 

来源:Pexels

 

国际象棋并没有死。文学界总是定期出现一些关于“小说已死”的说法,国际象棋界也是如此。尽管人类无法精确计算出国际象棋的种种复杂变化,但不知何故,他们知道最好的下棋方法。人类只需要一个国际象棋程序来证明他们的直觉一直都是正确的。

 

毫无疑问,艺术家中最伟大的棋手是马塞尔·杜尚。杜尚以放弃艺术而从事国际象棋事业闻名。1944年,他组织了一次名为《国际象棋的意象》的艺术展,展出了亚历山大·卡尔德、曼·雷、罗伯特·马瑟韦尔、伊夫·坦古伊、多萝西娅·丹宁和许多其他人的作品,这些作品确保了国际象棋界和艺术界之间永远不会失去联络。

 

这本不该发生。当DeepMind开始用游戏来破解智能时,它并不是在思考艺术和美,而是在思考价值,在医疗保健、能源、宏观经济、教育、机器人技术方面的价值。相比之下,杜尚放弃国际象棋艺术正是因为国际象棋没有任何价值。他说:“国际象棋没有社交目的。“最重要的是,这一点很重要。”

 

在机器学习的革命中,人们现在忽略的是,AlphaZero和 Stockfish 8的比赛代表了人类历史上第一次由机器创造出了“美”,而不是“价值”。也许这便是希望的来源。也许我们无需害怕世界末日或社交媒体的死亡。

 

宇宙中的大多数美丽不是人类创造的,璀璨的日落同样引人注目,因为它的出现完全没有借助于任何人力。

留言 点赞 关注

我们一起分享AI学习与发展的干货
欢迎关注全平台AI垂类自媒体 “读芯术”

(添加小编微信:dxsxbb,加入读者圈,一起讨论最新鲜的人工智能科技哦~)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章