DeepMind是如何重塑國際象棋之美的？

全文共3619字，預計學習時長11分鐘

來源：Pexels

職業斯諾克檯球是一種和彈子球類似的遊戲，這個遊戲風靡英國的同時，人們對遊戲中的“戰術”一詞始終迷惑不解。

一般來講，在斯諾克檯球裏有兩種等分球，一種是可直接得分的入袋球，另一種是可以爲對方製造障礙的安全球。在斯諾克規則下，一場比賽可能會陷入曠日持久的安全對壘，並不僅針對較爲隨意的玩家，比賽雙方都不想把球裝進自己的口袋。有些人把這種遊戲模式稱爲“戰術型”。其實這種說法是錯的。最合適的詞語應該是“策略型”。

職業國際象棋並非浪得虛名，國際象棋中戰術和戰略的區別曾被奧地利出生的特級大師薩維利•塔爾塔科沃(SaviellyTartakower)描述爲：國際象棋國際象棋“有目標時你有的是戰術，沒目標時你有的是策略”，他的解釋耐人尋味。

這二者的區別對理解（或者不如說欣賞）最近突然興起的國際象棋熱來說至關重要。去年，一個名爲AlphaZero的程序和另一個程序Stockfish 8競爭，在技術層面上，AlphaZero一騎絕塵，把Stockfish 8遠遠拋在身後。這場對決在計算機，人力，智能以及未來發展方面都值得探討，也許，在藝術和審美方面，我們也能有些意外的收穫。

那麼，什麼是國際象棋之美呢？

我想試着解釋這個概念，畢竟在我寫第一本書《國際象棋大師》時我就已經開始研究這個問題了。簡單來說，國際象棋是有法可依的，這個法就是指遊戲的規則，國際象棋裏也有一些取勝的套路。國際象棋之美就在於玩家往往能夠另闢蹊徑，險中取勝。

這種劫後餘生的欣喜必然會讓玩家們體會到國際象棋這一藝術的博大精深。

就國際象棋中的騎士而言，通過L型移動，位於棋盤中間的騎士可以控制或攻擊八格棋盤，而相反，位於角落的騎士的只能攻擊兩格。因此，客觀來講，位於棋盤中間的騎士比位於角落的騎士增加了四倍的殺傷力。

因此，正如波蘭國際象棋大師西格貝特·塔拉施所言：邊馬爲棄馬。但是如果你執意要把你的騎士移動到角落的位置，而恰好就是因爲這一招讓你最終成功取勝，那麼，這就是國際象棋的迷人之處了，這種劫後餘生的欣喜必然會讓玩家們體會到國際象棋這一藝術的博大精深。

幾年前，人工智能公司DeepMind開始用遊戲挑戰人腦。他們認爲如果能開發一套能夠進行自我教學的系統，以排除人腦計算的誤差偏見和先入爲主的影響，那麼它“自己就能賦予自己智力並且運用這種智力解決其他問題”。這種想法很快在亞洲圍棋上得以實現，然後又在國際象棋上開展了應用範圍更廣的實驗，國際象棋。

來源：Pexels

2016年，DeepMind研發的這套程序成功打敗了世界頂級圍棋棋手，來自韓國的李世石。下一個目標就是國際象棋，儘管此次不再是人機對戰。當前目標是要打敗世界頂尖的電腦程序，也稱“國際象棋引擎”，該程序已經經過了數十年的進化升級。

在繼續講電腦程序之前，我們需先追溯象棋的歷史，回到戰術和策略上來。國際象棋的規則並不死板，不屬於硬性規定，但人們普遍認爲，無論是對玩家還是一旁的觀棋者來說，戰術棋類遊戲會更有趣，比如棋子交換、“對賭”或犧牲棋子、配合攻擊和“狩獵國王”。這之中的美學意趣取決於棋手的戰術。相比之下，戰略型遊戲的理論優勢在30或40步以內就已成定局，看起來毫無意義。歷史上，這種風格的球員有古巴世界冠軍何塞·勞爾·卡巴布蘭卡和俄羅斯世界冠軍米哈伊爾·博特文尼克，他們被嘲諷爲一羣冷冰冰的機器人。

這就是奇怪之處，因爲事實證明策略型遊戲比戰術型遊戲更有“人情味”。

或者我們看到的只是表象。隨着國際象棋程序不斷升級，人們認爲戰術是創造性的，且依賴於直覺。一臺冷冰冰的機器或許能夠依靠策略完成一場像樣的比賽，但它永遠無法與一個能夠帶來更深刻的戰術創造力和擁有獨創性的人類玩家競爭。然而，當這些電腦程序最終獲得足夠強大的計算能力時，人們發現制定策略其實非常簡單。只要計算能力足夠深入和強大，計算機可以很容易地“看出”任何可以隱藏花哨的戰術的地方。事實上，戰術毫無創意可言。事實證明，在一段不長的時期內，人類玩家可以設法保持與國際象棋程序勢均力敵，因爲依靠策略思維，他們有時可以憑直覺地深入到比引擎計算更深的位置。

本質上，國際象棋程序是人類玩家的完美版本。正如1997年擊敗俄羅斯世界冠軍加里·卡斯帕羅夫的“深藍”程序，強悍的國際象棋程序結合了計算能力、此前出現的國際象棋遊戲的綜合資料庫和權威國際象棋智慧百科全書（邊馬即棄馬）。而它的弱點是，國際象棋程序終究也只是個程序。也就是說，如果編寫代碼的人對國際象棋的理解存在有缺陷或錯誤的假設，那麼這個引擎也就存在了同樣的bug。

無論如何，國際象棋程序很快就會輕鬆擊敗世界頂級大師。不僅如此，這些程序與人或其他引擎之間的對戰，會讓觀衆們感到既冷酷又呆板。戰術容易被駁倒，所以比賽變得更富策略性，也更沉悶。國際象棋界擔心這個已有幾百年歷史的博弈遊戲已被破解。“不可玩”成了一個術語，用來形容遠遠超出理解的情況，你所能做的也就是聳聳肩。看起來這個遊戲已經失去了活力。

當DeepMind開發AlphaZero時，它完全不具備國際象棋的高級知識。沒有記錄已公開的招式。沒有像“深藍”那樣，包含了一部匯聚了人類一千多年的博弈歷程的國際象棋智慧百科全書，它只是記錄了遊戲規則。

9個小時內，AlphaZero以每秒超過1000次的速度，進行了4400萬次博弈，，以學習如何對弈。之後它與Stockfish8競爭。2017年底向公衆發佈了10場比賽，2018年年初又發佈了數十場比賽。從那以後，國際象棋進入了新世界。

互聯網以無數種方式改變了國際象棋，其中一個重要的變化是，越來越多的國際象棋玩家自己製作視頻來討論國際象棋，講述一些經典招式的前世今生，或者最近幾次的比賽。推特上的英國博主kingscrusher上傳了9000多個視頻，吸引了10.4萬粉絲；克羅地亞YouTuber agadmator吸粉50萬，視頻點擊近 10億次。

最令人興奮的是AlphaZero的戰術。它犧牲了兵和棋子，把主教和皇后搬到了棋盤的角落。它以人類玩家從未考慮過的方式冒險。

以上博主和許多其他評論員製作了大量分析AlphaZeroVS Stockfish 8遊戲的視頻。這些視頻最有趣的地方在於，分析人士對AlphaZero的遊戲風格有着無限的熱情。有時，AlphaZero的舉動會讓他們感到困惑不解，但也會讓他們着迷。他們的反應就好像他們面對的是一部代表着突破、飛躍的藝術家的作品。

最令人興奮的是AlphaZero的戰術。它犧牲了兵和棋子，把主教和皇后搬到了棋盤的角落。它以人類玩家從未考慮過的方式冒險。這次冒險意義深遠。首先，國際象棋界又錯了——這次是第一回合就錯了。戰術打法確實是下棋的最好方法。第二，一千多年來的流傳的那些所謂必勝法則還遠遠不夠——或者換句話說，AlphaZero證明，那些被視爲堅如磐石的法則現在可以被輕而易舉地推翻。

來源：Pexels

國際象棋並沒有死。文學界總是定期出現一些關於“小說已死”的說法，國際象棋界也是如此。儘管人類無法精確計算出國際象棋的種種複雜變化，但不知何故，他們知道最好的下棋方法。人類只需要一個國際象棋程序來證明他們的直覺一直都是正確的。

毫無疑問，藝術家中最偉大的棋手是馬塞爾·杜尚。杜尚以放棄藝術而從事國際象棋事業聞名。1944年，他組織了一次名爲《國際象棋的意象》的藝術展，展出了亞歷山大·卡爾德、曼·雷、羅伯特·馬瑟韋爾、伊夫·坦古伊、多蘿西婭·丹寧和許多其他人的作品，這些作品確保了國際象棋界和藝術界之間永遠不會失去聯絡。

這本不該發生。當DeepMind開始用遊戲來破解智能時，它並不是在思考藝術和美，而是在思考價值，在醫療保健、能源、宏觀經濟、教育、機器人技術方面的價值。相比之下，杜尚放棄國際象棋藝術正是因爲國際象棋沒有任何價值。他說：“國際象棋沒有社交目的。“最重要的是，這一點很重要。”

在機器學習的革命中，人們現在忽略的是，AlphaZero和 Stockfish 8的比賽代表了人類歷史上第一次由機器創造出了“美”，而不是“價值”。也許這便是希望的來源。也許我們無需害怕世界末日或社交媒體的死亡。

宇宙中的大多數美麗不是人類創造的，璀璨的日落同樣引人注目，因爲它的出現完全沒有藉助於任何人力。

留言點贊關注

我們一起分享AI學習與發展的乾貨
歡迎關注全平臺AI垂類自媒體 “讀芯術”

（添加小編微信：dxsxbb，加入讀者圈，一起討論最新鮮的人工智能科技哦～）

DeepMind是如何重塑國際象棋之美的？

py發送email

爲什麼要⽤ Foundry

【筆記】動手學深度學習-預備知識

MySQL 分庫分表方案，總結太全了。。

Qt/C++音視頻開發71-指定mjpeg/h264格式採集本地攝像頭/存儲文件到mp4/設備推流/採集推流

WPF開源輕便、快速的桌面啓動器

公司來了個新同事，把 DDD 運用得爐火純青！

還在“收集”證書？學好數據科學，做項目纔是第一位的

如果必須重新開始，我會怎樣開啓自己的數據科學之旅？

寫出你的第一個web app，幾行代碼就夠了

研究了500+數據科學麪試問題之後，我發現了這些規律……

質子之死：粒子衰變如何推出萬有理論

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結