計算納什均衡難點
compute a Nash equilibrium
納什均衡早期歷史:
Lemke-Howson算法:
-
核心部分是兩組變量 s和r。s表示兩個博弈者的混合策略,參與者1和2 例如s1
-
:表示博弈者2在混合策略中採取行動k的概率
-
s1和s2表示了兩個參與者的混合策略 參與者1和2
-
r被稱作鬆弛變量 slack variables
-
有數學優化問題的本質問題以及概率分佈,線性互補問題
-
此外,他們提出了求解的一個特殊方法。基本思想:初始化s和r,手動把它們初始化爲0 ,然後一個一個改變 這是繞轉過程 (pivoting procedure) ,將s和r交替改變 將現在的值提取出來並用一個互補值替換。如果提出的是r 用s替換,如果是s 用r代替。這就是大概的思想。
彙總:
Lemke-Howson是深入運用納什均衡本質的一個過程,建立一個最優化問題模型,然後通過一個非常規的方法解決變量的空間。
另一種完全不一樣的步驟:
-
這個並沒有那麼深入運用均衡的結構,但通過啓發式搜索(uristic search)彌補了這一點
-
第一步:當你找到了策略組合的支集,判斷這個支集有沒有納什均衡,將會是一個簡單的問題,回顧一下策略的支集的概念,它是由混合策略中所有概率不爲0的行動組成的。這就是線性規劃,可以在多項式時間內求解,理論上是一個多項式時間的過程
Step2:Smart heuritic search through all sets of support.
步驟2:使用支集集合的啓發式搜索
基本思想如下:我們將支集與和它大小相近的支集配對,也就是說 我們不會只考慮一個博弈者 採取兩種隨機策略,而另一個博弈者考慮17種策略,我們會注意那些支集大小相似的博弈者,採取的策略組合 ,從小的支集逐漸過渡到大的支集。
最後證明 雖然這個步驟在最壞情況下是指數級別的
我們有辦法改進嗎?有優於指數級別的過程嗎?
複雜分析的領域
複雜度層級
-
P層代表的是多項式複雜度的問題類
-
NP層是可在多項式時間內驗證解,但不一定能在多項式時間內找到解的問題類
-
NP-complete層 是NP層中最難的一部分,所有NP層問題都可以歸到這個層級裏
-
當今理論計算機科學最大的未解之謎也許是就時NP是否不等於P ,普遍認爲不等於 ,但還沒有人能證明。
PPAD 全稱爲有向圖的多項式校驗參數
(Polynomial Parity Arguments On Directed graph)
-
由克里斯托斯·帕帕迪米特里烏於1994年提出,簡單來說 PPAD是TFNP類的一種,而TFNP是FNP的一種,具體不討論,但這確實能幫助我們確定尋找納什均衡的複雜度層級。
-
我們有可在多項式時間內求解的問題類,包括在可在多項式時間內可驗證的問題類以及這類問題中最難解決的一部分
-
PPAD問題會被放在這個圖裏的某一個位置