組合博弈理論

以下是我從網上收集的關於組合博弈的資料彙總:

有一種很有意思的遊戲,就是有物體若干堆,可以是火柴棍或是圍棋子等等均可。兩個
人輪流從堆中取物體若干,規定最後取光物體者取勝。這是我國民間很古老的一個遊戲
,別看這遊戲極其簡單,卻蘊含着深刻的數學原理。下面我們來分析一下要如何才能夠
取勝。

(一)巴什博奕(Bash Game):只有一堆n個物品,兩個人輪流從這堆物品中取物,規
定每次至少取一個,最多取m個。最後取光者得勝。

    顯然,如果n=m+1,那麼由於一次最多隻能取m個,所以,無論先取者拿走多少個,
後取者都能夠一次拿走剩餘的物品,後者取勝。因此我們發現瞭如何取勝的法則:如果
n=(m+1)r+s,(r爲任意自然數,s≤m),那麼先取者要拿走s個物品,如果後取者拿走
k(≤m)個,那麼先取者再拿走m+1-k個,結果剩下(m+1)(r-1)個,以後保持這樣的
取法,那麼先取者肯定獲勝。總之,要保持給對手留下(m+1)的倍數,就能最後獲勝。
    這個遊戲還可以有一種變相的玩法:兩個人輪流報數,每次至少報一個,最多報十
個,誰能報到100者勝。
(二)威佐夫博奕(Wythoff Game):有兩堆各若干個物品,兩個人輪流從某一堆或同
時從兩堆中取同樣多的物品,規定每次至少取一個,多者不限,最後取光者得勝。

    這種情況下是頗爲複雜的。我們用(ak,bk)(ak ≤ bk ,k=0,1,2,…,n)表示
兩堆物品的數量並稱其爲局勢,如果甲面對(0,0),那麼甲已經輸了,這種局勢我們
稱爲奇異局勢。前幾個奇異局勢是:(0,0)、(1,2)、(3,5)、(4,7)、(6,
10)、(8,13)、(9,15)、(11,18)、(12,20)。

    可以看出,a0=b0=0,ak是未在前面出現過的最小自然數,而 bk= ak + k,奇異局勢有
如下三條性質:

    1。任何自然數都包含在一個且僅有一個奇異局勢中。
    由於ak是未在前面出現過的最小自然數,所以有ak > ak-1 ,而 bk= ak + k > ak
-1 + k-1 = bk-1 > ak-1 。所以性質1。成立。
    2。任意操作都可將奇異局勢變爲非奇異局勢。
    事實上,若只改變奇異局勢(ak,bk)的某一個分量,那麼另一個分量不可能在其
他奇異局勢中,所以必然是非奇異局勢。如果使(ak,bk)的兩個分量同時減少,則由
於其差不變,且不可能是其他奇異局勢的差,因此也是非奇異局勢。
    3。採用適當的方法,可以將非奇異局勢變爲奇異局勢。

    假設面對的局勢是(a,b),若 b = a,則同時從兩堆中取走 a 個物體,就變爲了
奇異局勢(0,0);如果a = ak ,b > bk,那麼,取走b  – bk個物體,即變爲奇異局
勢;如果 a = ak ,  b < bk ,則同時從兩堆中拿走 ak – ab – ak個物體,變爲奇異局
勢( ab – ak , ab – ak+ b – ak);如果a > ak ,b= ak + k,則從第一堆中拿走多餘
的數量a – ak 即可;如果a < ak ,b= ak + k,分兩種情況,第一種,a=aj (j < k)
,從第二堆裏面拿走 b – bj 即可;第二種,a=bj (j < k),從第二堆裏面拿走 b – a
j 即可。

    從如上性質可知,兩個人如果都採用正確操作,那麼面對非奇異局勢,先拿者必勝
;反之,則後拿者取勝。

    那麼任給一個局勢(a,b),怎樣判斷它是不是奇異局勢呢?我們有如下公式:

    ak =[k(1+√5)/2],bk= ak + k  (k=0,1,2,…,n 方括號表示取整函數)

奇妙的是其中出現了黃金分割數(1+√5)/2 = 1。618…,因此,由ak,bk組成的矩形近
似爲黃金矩形,由於2/(1+√5)=(√5-1)/2,可以先求出j=[a(√5-1)/2],若a=[
j(1+√5)/2],那麼a = aj,bj = aj + j,若不等於,那麼a = aj+1,bj+1 = aj+1
+ j + 1,若都不是,那麼就不是奇異局勢。然後再按照上述法則進行,一定會遇到奇異
局勢。

(三)尼姆博奕(Nimm Game):有三堆各若干個物品,兩個人輪流從某一堆取任意多的
物品,規定每次至少取一個,多者不限,最後取光者得勝。

    這種情況最有意思,它與二進制有密切關係,我們用(a,b,c)表示某種局勢,首
先(0,0,0)顯然是奇異局勢,無論誰面對奇異局勢,都必然失敗。第二種奇異局勢是
(0,n,n),只要與對手拿走一樣多的物品,最後都將導致(0,0,0)。仔細分析一
下,(1,2,3)也是奇異局勢,無論對手如何拿,接下來都可以變爲(0,n,n)的情
形。

    計算機算法裏面有一種叫做按位模2加,也叫做異或的運算,我們用符號(+)表示
這種運算。這種運算和一般加法不同的一點是1+1=0。先看(1,2,3)的按位模2加的結
果:

1 =二進制01
2 =二進制10
3 =二進制11 (+)
———————
0 =二進制00 (注意不進位)

    對於奇異局勢(0,n,n)也一樣,結果也是0。

    任何奇異局勢(a,b,c)都有a(+)b(+)c =0。

如果我們面對的是一個非奇異局勢(a,b,c),要如何變爲奇異局勢呢?假設 a < b
< c,我們只要將 c 變爲 a(+)b,即可,因爲有如下的運算結果: a(+)b(+)(a(+)
b)=(a(+)a)(+)(b(+)b)=0(+)0=0。要將c 變爲a(+)b,只要從 c中減去 c-(
a(+)b)即可。

    例1。(14,21,39),14(+)21=27,39-27=12,所以從39中拿走12個物體即可達
到奇異局勢(14,21,27)。

    例2。(55,81,121),55(+)81=102,121-102=19,所以從121中拿走19個物品
就形成了奇異局勢(55,81,102)。

    例3。(29,45,58),29(+)45=48,58-48=10,從58中拿走10個,變爲(29,4
5,48)。

    例4。我們來實際進行一盤比賽看看:
        甲:(7,8,9)->(1,8,9)奇異局勢
        乙:(1,8,9)->(1,8,4)
        甲:(1,8,4)->(1,5,4)奇異局勢
        乙:(1,5,4)->(1,4,4)
        甲:(1,4,4)->(0,4,4)奇異局勢
        乙:(0,4,4)->(0,4,2)
        甲:(0.4,2)->(0,2,2)奇異局勢
        乙:(0,2,2)->(0,2,1)
        甲:(0,2,1)->(0,1,1)奇異局勢
        乙:(0,1,1)->(0,1,0)
        甲:(0,1,0)->(0,0,0)奇異局勢
        甲勝。


 

 

取火柴的遊戲
題目1:今有若干堆火柴,兩人依次從中拿取,規定每次只能從一堆中取若干根, 
可將一堆全取走,但不可不取,最後取完者爲勝,求必勝的方法。 
題目2:今有若干堆火柴,兩人依次從中拿取,規定每次只能從一堆中取若干根, 
可將一堆全取走,但不可不取,最後取完者爲負,求必勝的方法。
嘿嘿,這個遊戲我早就見識過了。小時候用珠算玩這個遊戲:第一檔撥一個,第二檔撥兩個,依次直到第五檔撥五個。然後兩個人就輪流再把棋子撥下來,誰要是最後一個撥誰就贏。有一次暑假看見兩個小孩子在玩這個遊戲,我就在想有沒有一個定論呢。下面就來試着證明一下吧
先解決第一個問題吧。
定義:若所有火柴數異或爲0,則該狀態被稱爲利他態,用字母T表示;否則, 
爲利己態,用S表示。
[定理1]:對於任何一個S態,總能從一堆火柴中取出若干個使之成爲T態。
證明:
    若有n堆火柴,每堆火柴有A(i)根火柴數,那麼既然現在處於S態,
      c = A(1) xor A(2) xor … xor A(n) > 0;
    把c表示成二進制,記它的二進制數的最高位爲第p位,則必然存在一個A(t),它二進制的第p位也是1。(否則,若所有的A(i)的第p位都是0,這與c的第p位就也爲0矛盾)。
    那麼我們把x = A(t) xor c,則得到x < A(t).這是因爲既然A(t)的第p位與c的第p位同爲1,那麼x的第p位變爲0,而高於p的位並沒有改變。所以x < A(t).而
    A(1) xor A(2) xor … xor x xor … xor A(n)
  = A(1) xor A(2) xor … xor A(t) xor c xor … xor A(n)
  = A(1) xor A(2) xor… xor A(n) xor A(1) xor A(2) xor … xor A(n)
  = 0
這就是說從A(t)堆中取出 A(t) – x 根火柴後狀態就會從S態變爲T態。證畢
[定理2]:T態,取任何一堆的若干根,都將成爲S態。
證明:用反證法試試。
      若
      c = A(1) xor A(2) xor … xor A(i) xor … xor A(n) = 0;
      c’ = A(1) xor A(2) xor … xor A(i’) xor c xor … xor A(n) = 0;
      則有
c xor c’ = A(1) xor A(2) xor … xor A(i) xor … xor A(n) xor A(1) xor A(2) xor … xor A(i’) xor c xor … xor A(n) = A(i) xor A(i’) =0
      進而推出A(i) = A(i’),這與已知矛盾。所以命題得證。
[定理 3]:S態,只要方法正確,必贏。 
  最終勝利即由S態轉變爲T態,任何一個S態,只要把它變爲T態,(由定理1,可以把它變成T態。)對方只能把T態轉變爲S態(定理2)。這樣,所有S態向T態的轉變都可以有己方控制,對方只能被動地實現由T態轉變爲S態。故S態必贏。
[定理4]:T態,只要對方法正確,必敗。 
  由定理3易得。 
接着來解決第二個問題。
定義:若一堆中僅有1根火柴,則被稱爲孤單堆。若大於1根,則稱爲充裕堆。
定義:T態中,若充裕堆的堆數大於等於2,則稱爲完全利他態,用T2表示;若充裕堆的堆數等於0,則稱爲部分利他態,用T0表示。
 
孤單堆的根數異或只會影響二進制的最後一位,但充裕堆會影響高位(非最後一位)。一個充裕堆,高位必有一位不爲0,則所有根數異或不爲0。故不會是T態。
[定理5]:S0態,即僅有奇數個孤單堆,必敗。T0態必勝。 
證明:
S0態,其實就是每次只能取一根。每次第奇數根都由己取,第偶數根都由對 
方取,所以最後一根必己取。敗。同理,  T0態必勝#
[定理6]:S1態,只要方法正確,必勝。 
證明:
若此時孤單堆堆數爲奇數,把充裕堆取完;否則,取成一根。這樣,就變成奇數個孤單堆,由對方取。由定理5,對方必輸。己必勝。  # 
[定理7]:S2態不可轉一次變爲T0態。 
證明:
充裕堆數不可能一次由2變爲0。得證。  #

[定理8]:S2態可一次轉變爲T2態。 
證明:
由定理1,S態可轉變爲T態,態可一次轉變爲T態,又由定理6,S2態不可轉一次變爲T0態,所以轉變的T態爲T2態。  # 
[定理9]:T2態,只能轉變爲S2態或S1態。 
證明:
由定理2,T態必然變爲S態。由於充裕堆數不可能一次由2變爲0,所以此時的S態不可能爲S0態。命題得證。 
[定理10]:S2態,只要方法正確,必勝. 
證明:
方法如下: 
      1)  S2態,就把它變爲T2態。(由定理8) 
      2)  對方只能T2轉變成S2態或S1態(定理9)
    若轉變爲S2,  轉向1) 
    若轉變爲S1,  這己必勝。(定理5) 
[定理11]:T2態必輸。 
證明:同10。 
綜上所述,必輸態有:  T2,S0 
          必勝態:    S2,S1,T0. 
兩題比較: 
第一題的全過程其實如下: 
S2->T2->S2->T2->  ……  ->T2->S1->T0->S0->T0->……->S0->T0(全0) 
第二題的全過程其實如下: 
S2->T2->S2->T2->  ……  ->T2->S1->S0->T0->S0->……->S0->T0(全0) 
下劃線表示勝利一方的取法。  是否發現了他們的驚人相似之處。 
我們不難發現(見加黑部分),S1態可以轉變爲S0態(第二題做法),也可以轉變爲 
T0(第一題做法)。哪一方控制了S1態,他即可以有辦法使自己得到最後一根(轉變爲 
T0),也可以使對方得到最後一根(轉變爲S0)。 
  所以,搶奪S1是制勝的關鍵! 
  爲此,始終把T2態讓給對方,將使對方處於被動狀態,他早晚將把狀態變爲S1.

 
推薦HDOJ題目
http://acm.hdu.edu.cn/showproblem.php?pid=1907
http://acm.hdu.edu.cn/showproblem.php?pid=2509
看完上面的結論,就能順利解決上面2道了
 
 



S-Nim
http://acm.hdu.edu.cn/showproblem.php?pid=1536
http://acm.hdu.edu.cn/showproblem.php?pid=1944
 
 
 
博弈算法入門小節 1536 1517 1907
小子最近迷途於博弈之中。。。感觸頗深。
爲了讓大家能夠在學習博弈的時候少走彎路,最重要的也是爲了加深自己的影響,溫故而知新,特發此貼與大家共勉。
學博弈先從概念開始:
特別推薦LCY老師的課件:博弈入門。
下載地址:http://acm.hdu.edu.cn/forum/read.php?tid=6875
這個課件個人認爲從博弈的基本思想,一直到解博弈的中心算法做了很好的詮釋。但是特別要注意的是。課件後面一部分英語寫的講義是重中之重。小子英語很弱,在這困擾很久。現在爲大家大概介紹一下。
主要是後繼點和SG值的問題:
SG值:一個點的SG值就是一個不等於它的後繼點的SG的且大於等於零的最小整數。
後繼點:也就是按照題目要求的走法(比如取石子可以取的數量,方法)能夠走一步達到的那個點。
具體的有關SG值是怎麼運用的希望大家自己多想想。
課件後面有一個1536的代碼。可以放在後面做做
看到這裏推薦大家做幾道題:1846(最簡單的博弈水題)
1847(求SG值)

 

有了上面的知識接下來我們來看看組合博弈(n堆石子)
推薦大家看個資料:
博弈-取石子游戲(推薦等級五星級)
http://acm.hdu.edu.cn/forum/read.php?fid=20&tid=5748
http://hi.baidu.com/netnode/blog/item/30932c2edc7384514fc226ea.html
這裏提出了一個奇異狀態的問題。看了這篇文章你會發現異或運算在博弈中使用的妙處。當然這裏指出的只是組合博弈中一種特殊情況。
王道還是對SG值的求解,但是知道這麼一種思路無疑對思維的廣度和深度擴展是很有幫助的。
ZZ博弈
http://acm.hdu.edu.cn/forum/read.php?fid=9&tid=10617
這裏介紹了組和博弈的兩種大的類型,一種是最後取的是N狀態一種是最後取的是P狀態,兩個狀態的解題方法能看懂很有幫助。當然,能夠把推導過程理解,吃透無疑是大牛級的做法~小子也佩服的緊~   
    1536題推薦做做這題,這題前面提醒大家是一個求SG值的題目,題目前面是對異或運算運用在組合博弈問題中的很好的解釋。當然題目本身是有所不同的。因爲在這裏面對取法有所要求。那麼這樣就回歸到了解決博弈問題的王道算法——求SG值上。
    有關運用求SG值的博弈題目有: 1850(也可基於奇異狀態異或)
1848(中和的大斐波那契數列的典型求SG值題)
1517(個人認爲有點猥瑣的題目。。。。在此題上困擾很久。當然搞出來很開心。小子是用比較規矩的求SG值的方法求出來的,但是論壇有人對其推出來了規律,這裏佩服一下,大家可以學習一下)
1079(更猥瑣的題目,對新手要求較高,因爲按傳統方法需要比較細緻的模擬加對邊角狀態的考慮,同樣有人推出來了公式)
當你全部看完以上的東西。做完以上的題目的話。。。小子恭喜你~你博弈入門了~~~~
    這裏小子告訴大家。博弈很強大。學習要耐心~謝謝

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章