博弈

  博弈可以理解爲有限策略選擇的競爭性活動,比如下棋、打牌、競爭、戰爭等。根據參與者種類和策略選擇的方式可以將博弈分爲很多種,本章討論的是棋類遊戲有關簡單的“二人零和、全信息、非偶然”博弈,也就是我們常說的零和博弈(Zero-sum Game)。 所謂“零和”,就是有贏必有輸,不存在雙贏的結果。所謂“全信息”,也指參與博弈的雙方進行決策是能夠了解的信息是公開和透明的,不存在信息不對稱的情況。比如棋類遊戲的棋盤和棋子狀態是公開的,下棋的雙方都可以看到當前所以棋子的位置,但是很多棋類遊戲則不滿足全信息的條件,因爲棋類遊戲都不公開自己手中的牌,也看不到對手手中的牌。所謂的“非偶然”,是指參與博弈的雙方的決策都是“理智”的行爲,不存在失誤和碰運氣的情況。

  在博弈過程中,任何一方都希望自己取得勝利,當某一方當前有多個行動方案可供選擇時,他總是挑選對自己最爲有利同時對對方最爲不利的按個行動方案。當然,博弈的另一方也會從多個行動方案中選擇一個對自己最爲有利的方案進行對抗。參與博弈的雙方在對抗或博弈的過程中會遇到各種狀態和移動(也可能是棋子落子)的選擇,博弈雙方交替選擇,每一次選擇都會產生一個新的棋局狀態。假如兩個棋手Max和Min 正在一個棋盤上進行博弈。 當Max 做選擇時,主動權在Max 上,Max 可以從多個可選決策方案中任選一個行動,一旦Max選定某個行動,主動權就轉移到了Min手中。 Min 也會有若干個可選決策方案, Min可能會選擇任何一個方案行動,因此Max 必須對做好應對Min 的每一種選擇。如果把棋盤抽象爲狀態,則Max每選擇一個決策方案就會觸發一個新狀態,Min也同樣,最終這些狀態就會形成一個狀態樹,這個附加了Max 和 Min的決策過程信息的狀態樹就是博弈樹(Game Tree)。博弈樹的根就是搜索開始時的棋盤狀態,每個子節點就是Max的每一種決策方案可能產生的棋盤狀態(局面),而這些子節點的子節點則是Min的每一種決策方案可能產生的棋盤狀態(各層相互間隔)。這棵樹的葉子節點就是最終結局,結果無非三種: Max 勝利、Min勝利或者平局。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章