人工智能教程 - 專業選修課程4.1.5 - 博弈論 1.退避機制,博弈基本概念,重要元素,形式

博弈論

博弈論研究的是兩位自利者的策略性互動。

博弈論在經濟學,計算機科學 ,政治學,心理學以及其他學科都非常重要。
同時考慮這些互動如何爲一些人所結構化,是爲是計算機體系獲取更好的收益。

Backoff Game

TCP協議中的退避機制 (backoff mechanisn)

在這裏插入圖片描述

在這裏插入圖片描述

在這裏插入圖片描述

  • 一個數學的評估方法,用於決定一個局中人對於特定情況的喜惡程度。

  • 收益函數描述了他們對於某個時間的態度,比如說明天的溫度將會是恰好25攝氏度,而實際上,收益函數還可以告訴我們他們對於一系列可能情況的概率分佈的喜惡。

  • 因此,收益函數描繪了他們對於不同事件不確定性的態度。比如說,如果明天的氣溫是25度的可能性是70%,24度的可能性是30%,

  • 對於這種喜好的理論決定方法,就是現代博弈論的基礎這個基礎就是,每個人都試圖將期望效益最大化。 。

在這裏插入圖片描述

博弈的基本概念和重要元素

最顯而易見的元素就是博弈中的參與者 players ,行動actions, 和收益 payoffs

在這裏插入圖片描述

博弈中的兩種基本形式

  • 一種是是範式博弈。最簡單,直接的表達形式。它用函數關係呈現了參與者收益和他們行爲的關係。通常,所有參與者都同時採取行動對於參與者的策略。

  • 另一種形式被稱爲展開形式的博弈,在這種形式下 我們會把時間這個因素考慮在內,博弈中誰會先採取行動,在什麼時間點採取行動,我們常常用一個樹把它們表示出來。

在這裏插入圖片描述

範式博弈

在這裏插入圖片描述

範式博弈的時候,利用矩陣是一種很簡便的方式

在這裏插入圖片描述

我們將第1個參與者用行來表示,第2個參與者用列來表示。兩個參與者要選擇採取的行動,這些行動用矩陣中的列來表示,每一個單元格用來表示收益

在這裏插入圖片描述

在這裏插入圖片描述

總結

在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章