原创 人工智能教程 - 專業選修課程4.3.5 - 強化學習 4.智能體分類,規劃,預測和控制等簡介

智能體分類 Categorizing RL agents 基於價值 Value Based No Policy (Implicit) Value Function 基於行動決策 Policy Based Polic

原创 【人工智能學習筆記】 1.1數學分析(一) -1.集合及其運算

聲明:部分內容來自於慕課,公開課等的課件,僅供學習使用。如有問題,請聯繫刪除。 部分內容來自電子科技大學,北京大學,清華大學,北航等的課件 集合及其運算    數學以其嚴謹而富有邏輯性聞名於世,其嚴謹性在於交代清楚問題,對象

原创 人工智能筆記之專業選修課4.1.5 - 博弈論 6.嚴格劣勢策略

嚴格劣勢策略 strictly dominated strategies 在穩定性和預測上analyzing games in terms of stability, in terms of predicting. ,人們可以想到

原创 【人工智能學習筆記】 1.1數學分析(一) -10.定積分

聲明:部分內容來自於慕課,公開課等的課件,僅供學習使用。如有問題,請聯繫刪除。 部分內容來自電子科技大學,北京大學,清華大學等的課件 定積分 引言    定積分可以用於求曲邊梯形的面積=∫abf(x)dx\int_{a}^

原创 人工智能筆記之專業選修課4.1.5 - 博弈論 8.完全信息擴展式博弈,子博弈

完全信息擴展式博弈 perfect information extensive-form games 是一種涉及時間的博弈。 回想一下 規範式博弈模型當中,所有參與者同時採取行動。這意味着很難用它們考慮人們要按順序做事的一些

原创 人工智能筆記之專業選修課4.1.5 - 博弈論 10.博弈學習,虛構博弈簡介,無悔學習簡介,後悔匹配簡介

博弈學習 (learning) 我們會看學習在重複博弈中的兩種學習類型 虛構博弈 (fictitious play) 無悔學習(no-regret learning) ,尤其是一個算法叫後悔匹配 (regret match

原创 人工智能筆記之專業選修課4.1.5 - 博弈論 11.貝葉斯博弈場景-拍賣,合作博弈論

貝葉斯博弈(Bayesian Games) 拍賣例子1 當我們講拍賣 auctions時,我們會想到1885年的木刻,它展示了澳大利亞墨爾本的茶葉拍賣。有一個戴着禮帽的人,站在房間的前面,他手裏拿着一個木槌,他可能會用一種詼諧的

原创 【人工智能學習筆記】 1.1數學分析(一) -4.無窮小量

聲明:部分內容來自於慕課,公開課等的課件,僅供學習使用。如有問題,請聯繫刪除。 部分內容來自電子科技大學,北京大學,清華大學等的課件 無窮小量 1.無窮小及其階  1.1 無窮小和無窮大的定義   無窮小的定義: 當x→

原创 人工智能筆記之專業選修課4.1.5 - 博弈論 5.計算納什均衡難點,複雜度層級,Lemke-Howson算法,PPAD

計算納什均衡難點 compute a Nash equilibrium 納什均衡早期歷史: 1928年約翰·馮·諾依曼 (John von Neumann),現代博弈論的奠基人之一:研究證明了零和博弈 (zero sum g

原创 【人工智能學習筆記】 1.3高等代數(一) -8.一般線性方程組的基本概念,線性方程組的初等變換,齊次線性方程組的解

聲明:部分內容來自於慕課,公開課等的課件,僅用於自學。如有問題,請聯繫刪除。 部分內容來自北京大學,清華大學等的課件 一般線性方程組的基本概念:係數矩陣,增廣矩陣 ;線性方程組的初等變換 1.一般線性方程組的基本概念

原创 【人工智能學習筆記】 1.1數學分析(一) -2.函數

聲明:部分內容來自於慕課,公開課等的課件,僅供學習使用。如有問題,請聯繫刪除。 部分內容來自電子科技大學,北京大學,清華大學等的課件 映射和函數    定義:設X,Y爲兩個非空集合,如果f是一種規則,對於∀x∈X\foral

原创 【人工智能學習筆記】 1.3高等代數(一) -9.n維向量的概念,n維向量的運算,n維向量空間

聲明:部分內容來自於慕課,公開課等的課件,僅用於自學。如有問題,請聯繫刪除。 部分內容來自北京大學,清華大學等的課件 n維向量的概念,n維向量的運算,n維向量空間 1.n維向量的概念 1.1 定義 由數域P上的n個數

原创 【人工智能學習筆記】 1.1數學分析(一) -7.導數

聲明:部分內容來自於慕課,公開課等的課件,僅供學習使用。如有問題,請聯繫刪除。 部分內容來自電子科技大學,北京大學,清華大學,北航等的課件 導數    導數是通過一些物理,幾何學等的應用中抽象出來的概念,瞬時速度和平均速度對

原创 人工智能筆記之專業選修課4.1.5 - 博弈論 7.極大極小策略,相關均衡

極大極小策略 MAXMIN strategies 在零和博弈的背景下特別有意義。實際上對所有博弈都會很有意義。 簡單地說,是參與者在假設其他參與者要給他難堪下,最大化他們的回報。 更爲一般地定義極大極小策略是:最大化我最壞情況下

原创 人工智能筆記之專業選修課4.1.5 - 博弈論 9.重複博弈,效用,隨機博弈

重複博弈 (repeated games) 當我們考慮世界上絕大部分互動時,其中很多不止會發生一次 市場上的公司 它們與競爭對手活動 朋友,你會交換嗎,你會在朋友需要幫助時幫助他們嗎?你需要時他們會幫你嗎?如果你有對你