人工智能筆記之專業選修課4.1.5 - 博弈論 5.計算納什均衡難點，複雜度層級，Lemke-Howson算法，PPAD

計算納什均衡難點

compute a Nash equilibrium

納什均衡早期歷史:

1928年約翰·馮·諾依曼 (John von Neumann)，現代博弈論的奠基人之一：研究證明了零和博弈 (zero sum game) 中存在納什均衡。
- 在證明過程中他使用了布勞威爾不動點定理
- 需要用到在線性規劃中計算不動點的算法
  - 一個是但澤 (Danzig) 的算法，相當於我們現在說的線性規劃對偶理論 (LP duality) ，在實踐中被廣泛應用的，這是指數複雜度的一個算法。
  - 卡哈基揚 (Khachiyan) 的多項式級線性規劃算法，實際上在實踐中並不常用

1950年約翰·納什證明了任意博弈中納什均衡的存在性
催生了一系列的算法
Lemke-Howson算法和由瑞恩·波特及其他人更晚提出的算法。
所有這些算法在最差情況下，都是指數級的

Lemke-Howson算法：

核心部分是兩組變量 s和r。s表示兩個博弈者的混合策略，參與者1和2 例如s1
$\LARGE s_2^k$ ：表示博弈者2在混合策略中採取行動k的概率
s1和s2表示了兩個參與者的混合策略參與者1和2
r被稱作鬆弛變量 slack variables
有數學優化問題的本質問題以及概率分佈，線性互補問題
此外，他們提出了求解的一個特殊方法。基本思想：初始化s和r，手動把它們初始化爲0 ，然後一個一個改變這是繞轉過程 (pivoting procedure) ，將s和r交替改變將現在的值提取出來並用一個互補值替換。如果提出的是r 用s替換，如果是s 用r代替。這就是大概的思想。

彙總：

Lemke-Howson是深入運用納什均衡本質的一個過程，建立一個最優化問題模型，然後通過一個非常規的方法解決變量的空間。

另一種完全不一樣的步驟：

這個並沒有那麼深入運用均衡的結構，但通過啓發式搜索(uristic search)彌補了這一點
第一步：當你找到了策略組合的支集,判斷這個支集有沒有納什均衡,將會是一個簡單的問題,回顧一下策略的支集的概念，它是由混合策略中所有概率不爲0的行動組成的。這就是線性規劃，可以在多項式時間內求解，理論上是一個多項式時間的過程

Step2:Smart heuritic search through all sets of support.

步驟2：使用支集集合的啓發式搜索

基本思想如下：我們將支集與和它大小相近的支集配對，也就是說我們不會只考慮一個博弈者採取兩種隨機策略，而另一個博弈者考慮17種策略，我們會注意那些支集大小相似的博弈者，採取的策略組合，從小的支集逐漸過渡到大的支集。
最後證明雖然這個步驟在最壞情況下是指數級別的

我們有辦法改進嗎？有優於指數級別的過程嗎？

複雜分析的領域

複雜度層級

P層代表的是多項式複雜度的問題類
NP層是可在多項式時間內驗證解，但不一定能在多項式時間內找到解的問題類
NP-complete層是NP層中最難的一部分，所有NP層問題都可以歸到這個層級裏
當今理論計算機科學最大的未解之謎也許是就時NP是否不等於P ，普遍認爲不等於，但還沒有人能證明。

PPAD 全稱爲有向圖的多項式校驗參數

(Polynomial Parity Arguments On Directed graph)

由克里斯托斯·帕帕迪米特里烏於1994年提出，簡單來說 PPAD是TFNP類的一種，而TFNP是FNP的一種，具體不討論，但這確實能幫助我們確定尋找納什均衡的複雜度層級。
我們有可在多項式時間內求解的問題類，包括在可在多項式時間內可驗證的問題類以及這類問題中最難解決的一部分
PPAD問題會被放在這個圖裏的某一個位置

最後，目前普遍認爲：計算納什均衡的時間複雜度高於多項式，雖然目前還無法證明。但我們可以將其放在我們熟悉的複雜度分層中。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

人工智能筆記之專業選修課4.1.5 - 博弈論 5.計算納什均衡難點，複雜度層級，Lemke-Howson算法，PPAD

計算納什均衡難點

compute a Nash equilibrium

納什均衡早期歷史:

1928年約翰·馮·諾依曼 (John von Neumann)，現代博弈論的奠基人之一：研究證明了零和博弈 (zero sum game) 中存在納什均衡。

在證明過程中 他使用了布勞威爾不動點定理

需要用到在線性規劃中計算不動點的算法

一個是但澤 (Danzig) 的算法，相當於我們現在說的線性規劃對偶理論 (LP duality) ，在實踐中被廣泛應用的，這是指數複雜度的一個算法。

卡哈基揚 (Khachiyan) 的多項式級線性規劃算法，實際上在實踐中並不常用

1950年約翰·納什證明了任意博弈中納什均衡的存在性

Lemke-Howson算法和由瑞恩·波特及其他人更晚提出的算法。

所有這些算法在最差情況下，都是指數級的

Lemke-Howson算法：

核心部分是兩組變量 s和r。s表示兩個博弈者的混合策略，參與者1和2 例如s1

s2k\LARGE s_2^ks2k​ ：表示博弈者2在混合策略中採取行動k的概率

s1和s2表示了兩個參與者的混合策略 參與者1和2

r被稱作鬆弛變量 slack variables

有數學優化問題的本質問題以及概率分佈，線性互補問題

彙總：

Lemke-Howson是深入運用納什均衡本質的一個過程，建立一個最優化問題模型，然後通過一個非常規的方法解決變量的空間。

另一種完全不一樣的步驟：

這個並沒有那麼深入運用均衡的結構，但通過啓發式搜索(uristic search)彌補了這一點

Step2:Smart heuritic search through all sets of support.

步驟2：使用支集集合的啓發式搜索

複雜分析的領域

複雜度層級

P層代表的是多項式複雜度的問題類

NP層是可在多項式時間內驗證解，但不一定能在多項式時間內找到解的問題類

NP-complete層 是NP層中最難的一部分，所有NP層問題都可以歸到這個層級裏

當今理論計算機科學最大的未解之謎也許是就時NP是否不等於P ，普遍認爲不等於 ，但還沒有人能證明。

PPAD 全稱爲有向圖的多項式校驗參數

由克里斯托斯·帕帕迪米特里烏於1994年提出，簡單來說 PPAD是TFNP類的一種，而TFNP是FNP的一種，具體不討論，但這確實能幫助我們確定尋找納什均衡的複雜度層級。

我們有可在多項式時間內求解的問題類，包括在可在多項式時間內可驗證的問題類以及這類問題中最難解決的一部分

PPAD問題會被放在這個圖裏的某一個位置

最後，目前普遍認爲：計算納什均衡的時間複雜度高於多項式，雖然目前還無法證明 。但我們可以將其放在我們熟悉的複雜度分層中。

在證明過程中他使用了布勞威爾不動點定理

$\LARGE s_2^k$ ：表示博弈者2在混合策略中採取行動k的概率

s1和s2表示了兩個參與者的混合策略參與者1和2

NP-complete層是NP層中最難的一部分，所有NP層問題都可以歸到這個層級裏

當今理論計算機科學最大的未解之謎也許是就時NP是否不等於P ，普遍認爲不等於，但還沒有人能證明。

最後，目前普遍認爲：計算納什均衡的時間複雜度高於多項式，雖然目前還無法證明。但我們可以將其放在我們熟悉的複雜度分層中。