送君千里終須一別,1勝2負,唯一戰勝過AlphaGo的人退役了

今天,傳奇棋手李世石九段退役紀念賽第三局在韓國全羅南道新安郡舉行,前兩局,李世石一勝一負。第三局,韓國AI“韓豆”(Handol)執白(讓二子)中盤戰勝,李世石九段以惜敗於AI的結局宣佈:唯一戰勝過AlphaGo的人退役了
在這裏插入圖片描述
至此,李世石結束長達24年零8個月的職業生涯。從此以後,「李世石九段」不會再以職業棋手的身份出現在衆人面前。

上午11時,李世石退役賽第三局在李世石九段的家鄉新安郡落子。

李世石九段的老師權甲龍先生也來到電視直播現場爲高徒加油助威,希望自己的愛徒能交出一份滿意的答卷,笑着離場,爲自己的圍棋生涯畫上一個圓滿的句號。

今天開局的序盤戰,AI韓豆就在右下角給李世石出了難題。爲此,李世石不得不頻頻“長考”,尋找應對良策。雙方在右下角形成對殺。韓豆白1“一路點”好手,令黑棋陷入困境。李世石經過“長考”,弈出了黑2“一路點”、黑4“二路託”組合妙手,成功化險爲夷。戰至黑66,李世石勝率爲81%。

但李世石在即將用完2個小時規定時間進入讀秒之前,意外出現了失誤,導致了形勢的大反轉。白棋的勝率也從35%一下子就躍升至75%,枰上的形勢瞬間發生了大反轉。

後半盤,形勢佔優的AI韓豆越戰越勇,沒給李世石九段任何反撲的機會。

最終,下午15時40分,在行至 181 手時,李世石無奈地向裁判揮了揮手示意投子認負。

這是三局之中耗時最長的一局,雙方對弈超過四小時。

看到敗局,恩師權甲龍也一臉沮喪,難掩失落。
在這裏插入圖片描述
李世石九段的退役紀念就此落幕。曾經的“不敗少年”李世石九段24年輝煌的職業圍棋傳奇就此落幕。

作爲李世石曾經的對手和一生的摯友,曾經「絕代雙驕」的另一人——中國圍棋職業選手古力九段,今天上午,也在社交媒體上關注好友李世石的退役賽。

“送君千里,終須一別。就讓我們再一次爲他吶喊助威吧!”,古力如是說道。
在這裏插入圖片描述
也有網友在頁面下留言:

“小李飛刀成絕響,不覺山川歲月長,祝福!”

此前有消息稱,韓國棋院最初準備邀請古力來跟李世石下這場告別戰。但李世石得知後婉拒了,“最後跟我下棋的人會多有負擔,多不舒服呀。”

李世石退役賽對韓豆戰績:

首局(讓子):李世石 勝
在這裏插入圖片描述

(第一局最終棋局)

次局(分先):李世石 負
在這裏插入圖片描述

(第二局最終棋局)

最終局(讓子):李世石 負
在這裏插入圖片描述

(第三局最終棋局)

人類再次在圍棋「人機大戰」中取得了一場勝利。谷歌 DeepMind 資深研究員、ALphaGo 主要程序開發者黃士傑曾在看完前兩盤對決之後表示,如果再有兩年的算法更新和優化,AlphaGo Master 將會是最強的棋手。但 AI 要做到萬無一失,仍需要解決 bug 問題。
在這裏插入圖片描述

從此棋壇再無「李世石九段」

在這裏插入圖片描述

2019年11月19日,韓國棋院發佈了李世石辭去職業棋手職務的消息,並在該文中總結了李世石九段在其24年職業生涯中,一共獲得50個冠軍,所獲獎金總額大約98億韓元(約合人民幣5900萬元)。

作爲一名圍棋選手,今年才36歲的李世石在慣例中顯然仍算得上年輕一輩,在此時選擇提交“辭職申請書”宣佈退役,對於外界來說無疑特別突然。

然而如果對李世石的過去有所瞭解,這已不是他第一次表露退役的念頭。

而這一切,都與李世石的強烈個性脫離不開。

佈局

進入中盤拼殺之前,儘可能地搶佔實地,創造有利條件。大到對弈經驗,小到臨場心情,都會影響到佈局。
在這裏插入圖片描述
那個“飛禽島少年”。

李世石出生在韓國全羅南道新安郡的飛禽島。小島交通閉塞,離它最近的陸地都有四十公里。

李世石的父親雖長年在島上務農,卻曾是師範大學的畢業生。喜愛圍棋的他從未拋棄教育者的情懷,經常教李世石兄妹五人下圍棋。五個孩子中,李世石天賦最高,是父親的重點培養對象,直到他八九歲時,父親已經不是他的對手了。於是,十歲的李世石以入段爲目標,來到了首爾的權甲龍圍棋道場。

1994年的入段選拔競爭激烈,即便是天賦異稟的李世石也未能一蹴而就,第一次入段嘗試以半目之差落敗。第二年,李世石憑藉強烈的勝負欲戰勝了年長自己3歲的同門師兄韓文德七段,終於成爲了一名職業圍棋選手,那一年,李世石13歲。

回顧起自己的入段之路,李世石覺得自己的好教練起了很大的作用。

在權甲龍道場的三年零六個月裏,李世石的師傅權甲龍自始至終都沒有對他採取“手把手教”和“人盯人管”的方式。相反,教練認爲學習圍棋並不是久坐在棋盤之前就能學好的,重點在於因材施教,尤其像李世石這樣愛玩好動的弟子,要等他自己頓悟。三年來,權甲龍對他採取的是“不接觸”的教學方式,只有在出現成績嚴重下滑,或是李世石主動請教的情況下才會出手相教。幫他做覆盤交流時,用的也是“這樣下會不會正確啊”這樣引導性的語言,絕不會直接指揮他具體該如何落子。

一位言傳身教、傾盡全力將李世石引領上圍棋生涯的父親,一位慧眼識人、懂得因材施教的好師傅,在加上自己的天賦和努力,李世石的圍棋生涯佈下了一個很好的序盤。

中盤

圍棋的中盤變化莫測,是圍棋精妙之所在。佈局,官子這兩個階段皆有定式,可從書籍,高手對局中學習模仿。而在中盤的戰鬥中,棋手能依靠的只有自身的修爲,眼力,和隨機應變能力。

初入段的職業棋手李世石早早便被一件事拖入了人生的中盤。

就在李世石決定退學並一心走上圍棋道路的那一年,他的父親去世了。這之後,由於未能在父親健在的時候讓他看到自己奪冠,李世石被悔意填滿,很長一段時間都無法擺脫父親去世的影響,成績一路下滑。直到2000年,李世石才重新振作,接連在巴卡斯杯天元戰中擊敗柳才馨九段,倍達王戰中擊敗劉昌赫九段,十天之內連獲兩個冠軍,並在2000年拿到了32連勝的戰績。父親的去世,讓李世石獲得了之前不曾擁有的勝負欲和殺氣。他曾因自悔而消沉,如今又因自省而崛起。

蛻變後的李世石一發不可收拾,2003年以三段的身份擊敗宋泰坤獲得富士通杯。心直口快的李世石當時宣稱段位根本無法體現實力,並拒絕參加段位賽提升自己的段位。

韓國棋院無法容忍“三段選手”李世石接連橫掃九段選手,爲了維護段位的權威性,便針對李世石制定了“國內比賽亞軍升一段,冠軍升兩段,世界冠軍升三段”的規定。之後,李世石便兩奪世界冠軍,“被迫”晉升九段。引用韓國棋院的一位官員的評價:“趕快把李世石弄到九段,免得他老在段位賽中搗亂。”特立獨行實力強悍的李世石收穫了許多讚譽,卻也因自己的直來直去與韓國棋院產生了嫌隙。

無論如何,處於職業生涯中盤期的李世石可以說是圍棋界最恐怖的獵手。如果說韓國圍棋名宿李昌鎬的棋風是序局穩健佈局,中盤步步爲營建立優勢,官子階段穩穩拿下勝利的話,那李世石就是一頭攻擊性極強的猛獸。他往往會草草結束佈局階段,將所有火力集中在中盤對殺,用穩準狠的攻擊將比賽殺死在中盤,讓終盤官子階段變得毫無意義。從2002年到2012年,這種兇狠的下法爲李世石贏得了14座世界冠軍獎盃。

2016年3月,圍棋機器人AlphaGo橫空出世,挑戰全世界人類棋手。年滿33歲的李世石代表全人類躺在了它的砧板上。

常年收割着勝利的獵手李世石連續三局任人宰割,0:3輸給了AI棋手AlphaGo。賽後他向人們道歉:“輸給電腦的只有我李世石一人,並不是整個人類。”

3月15日,人機大戰進入第四局,放下包袱的李世石執白子在第78手下出“神之一手”,AlphaGo陷入混亂,走出廢棋,李世石贏下一局,爲人類做出了唯一一次像樣的抵抗。

之後的AlphaGo在互聯網上化名Master,連續橫掃十餘名人類棋手,獲得60勝0負的戰績。2017年五月,AlphaGo 3:0擊敗排名世界第一的中國選手柯潔,圍棋界公認AlphaGo的弈棋能力已超出人類頂尖水平。李世石之後,人類一敗塗地。
在這裏插入圖片描述

李世石之後,人類再無像樣的抵抗。

終局

收官的功力,凝聚着棋手一輩子的心血。或功成名就,或功虧一簣,全在一念間。

2019年11月19日,李世石九段向韓國棋院遞交辭呈,選擇在當打之年結束自己的職業生涯。一時間,圍棋界衆說紛紜,最終卻都指向兩件事:李世石競技水平下降,和他與韓國棋院長達十餘年的糾葛。

早在今年三月,李世石在“三一運動一百週年紀念對局”中完敗於柯潔九段,之後便提出“將於一年之內放下職業棋手的職務”。

李世石的哥哥李相勳九段也曾表示,李世石之所以要求退役,是因爲他“贏得越來越少”,而且現在基本“無棋可下”。自去年7月30日於朴永訓九段對弈之後,李世石再也沒下過一盤棋。

人類真的永遠不會再戰勝 AI?

自從 2016 年 AlphaGo 大戰李世石之後,圍棋 AI 即被推上風口浪尖。基於近年以來深度學習和強化學習的發展,AlphaGo 和各類圍棋 AI 的不斷升級,人們一度認爲,人類再不可能戰勝 AI。

Handol 是韓國 NHN 娛樂公司推出的一款圍棋 AI,用以訓練的數據來自 1999 年以來 NHN 公司在遊戲業務方面的大量積累。

2019 年 1 月,Handol 連續戰勝了申旻埈九段、李東勳九段、金智碩九段、樸正煥九段和申真瑞九段五位韓國頂級圍棋選手,8 月在山東舉行的「中信證券杯」世界智能圍棋公開賽中,Handol 也捧回了季軍獎盃。

據「Handol」研發團隊估算,「Handol」的棋力水平相當於世界圍棋中的 4500 積分,而目前李世石的積分爲 3414 分,柯潔、樸廷桓等人類頂尖棋手的積分接近 3700 分。

在圍棋 AI 領域,棋力最高的選手仍然是 DeepMind 公司的 AlphaGo,它也是第一個擊敗人類圍棋世界冠軍的人工智能程序。在 2017 年柯潔與 AlphaGo 對戰之後,David Silver、谷歌大腦負責人 Jeff Dean 等人曾在烏鎮圍棋峯會現場對 AlphaGo 背後的技術進行過解讀。

AlphaGo 最初主要是依靠大量學習人類棋手的棋譜來提高棋藝,之後 進入到完全的自我深度學習階段,也就是完全摒棄人類棋手的思維方式,按照自己(左右互搏)的方式研究圍棋。結合監督學習與強化學習的優勢,AlphaGo 通過訓練形成一個策略網絡,將棋盤上的局勢作爲輸入信息,並對有所可行的落子位置形成一個概率分佈。然後訓練一個價值網絡對自我對弈進行預測,以-1(對手的絕對勝利)到 1(AlphaGo 的絕對勝利)的標準,預測所有可行落子位置的結果。
在這裏插入圖片描述
AlphaGo 真正的優勢來源於將策略網絡和價值網絡整合進基於概率的蒙特卡羅樹搜索(MCTS)中。在獲取棋局信息後,AlphaGo 會根據策略網絡探索哪個位置同時具備高潛在價值和高可能性,進而決定最佳落子位置。在分配的搜索時間結束時,模擬過程中被系統最繁瑣考察的位置將成爲 AlphaGo 的最終選擇。經過先期的全盤探索和過程中對最佳落子的不斷揣摩,AlphaGo 的探索算法就能在其計算能力之上加入近似人類的直覺判斷。2016 年 1 月 28 日,擊敗李世石的 AlphaGo 版本登上《Nature》封面,隨後在 3 月即 4:1 擊敗李世石,名聲大振。

烏鎮之後,DeepMind 宣佈 AlphaGo 從此不會再參與比賽,但在幾個月後推出了更強版本的圍棋 AI「AlphaGo Zero」。如果說 AlphaGo 版本最初還需要觀察數千場人類圍棋比賽來訓練如何學習圍棋,AlphaGo Zero 則直接跳過這一步,從自己完全隨機的下圍棋開始來學習圍棋,幾天之內即超越人類棋手的水平,並且以 100:0 的比分打敗了之前戰勝世界冠軍的 AlphaGo。

在圍棋 AI 領域,國內研究機構和企業也在發力,其中最有代表性的要數上文中李世石提到的騰訊圍棋 AI「絕藝」。「絕藝」誕生於 2016 年,實力或僅次於 AlphaGo。

絕藝」的訓練主要包括人類棋譜數據庫和機器自對弈,它的算法基於策略網絡與價值網絡兩大核心,並創新性地大幅提升了價值網絡的精度,使其大局觀表現更好。在 2018 騰訊世界人工智能圍棋大賽中,「絕藝」在決賽中 7:0 大勝另一款圍棋 AI「星陣」奪冠,半決賽五番棋和決賽七番棋不失一局,賽後「星陣」研發團隊亦稱讚「絕藝」已經「達到了 AlphaGo 的水準」。

雖然在圍棋的算力上,人類已經難以與機器相比,但棋手們可以通過與 AI 的對弈不斷提升自己的水平,甚至發展出更爲先進的戰術。據古力此前透露,「絕藝」已經成爲中國國家圍棋隊訓練專用 AI。

參考鏈接:
http://baijiahao.baidu.com/id=1650783145603674826&wfr=spider&for
http://baijiahao.baidu.com/id=1653521400125023901&wfr=spider&for
https://mp.weixin.qq.com/s/5P_5qV7JhLucHkVkHpSOBQ
https://en.yna.co.kr/view/AEN20191218004052315?section=search
https://pulsenews.co.kr/view.php?year=2019&no=1014122

更多文章請搜索公,衆。號“StrongerTang”,衆多資料分享,一起學習!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章