台部落AItrust

原创強化學習算法 DDPG 解決 CartPole 問題，代碼逐條詳解

本文內容源自百度強化學習 7 日入門課程學習整理感謝百度 PARL 團隊李科澆老師的課程講解使用DDPG解決連續控制版本的CartPole問題，給小車一個力（連續量）使得車上的擺杆倒立起來。文章目錄一、安裝依賴二、導入

2020-06-25 23:57:36

原创強化學習算法 Sarsa 解迷宮遊戲，代碼逐條詳解

本文內容源自百度強化學習 7 日入門課程學習整理感謝百度 PARL 團隊李科澆老師的課程講解強化學習算法 Sarsa 解迷宮遊戲文章目錄一、安裝依賴庫二、導入依賴庫三、智能體 Agent 的算法：Sarsa四、訓練和測試

2020-06-25 23:57:36

原创強化學習算法 Policy Gradient 解決 CartPole 問題，代碼逐條詳解

本文內容源自百度強化學習 7 日入門課程學習整理感謝百度 PARL 團隊李科澆老師的課程講解強化學習算法 DQN 解決 CartPole 問題，移動小車使得車上的擺杆保持直立。這個遊戲環境可以說是強化學習中的 “He

2020-06-25 23:57:36

原创 Latex 約等於

$a\approx b$ 顯示： a≈ba\approx ba≈b

2020-06-25 23:57:36

原创 C# 方法的定義，調用，和參數傳遞（學習心得 12）

用來執行一個任務的語句塊。每個 C# 程序至少有一個 Main 方法。使用方法需要：定義方法。調用方法。文章目錄一、定義方法二、調用方法三、遞歸方法調用四、參數傳遞4.1 按值傳遞參數4.2 按引用傳遞參數4.3 按

2020-06-25 23:57:26

1

原创 Latex 字體加粗

$\textbf{w}$ 顯示爲： w\textbf{w}w

2020-06-25 23:57:26

原创強化學習入門（一）強化學習的基礎概念及Gym庫，Parl庫介紹

本文內容源自百度強化學習7日入門課程學習整理感謝百度PARL團隊李科澆老師的課程講解文章目錄一、強化學習初印象二、什麼是強化學習三、GYM庫（環境庫）四、PARL庫（算法庫）一、強化學習初印象讓機器像人一樣學習：對

2020-06-25 23:57:26

原创 LaTex 底標

$\max \limits_{a<x<b}{f(x)}$ 顯示： max⁡a<x<b{f(x)}\max \limits_{a<x<b}\{f(x)\}a<x<bmax{f(x)}

2020-06-25 23:57:26

2

原创強化學習算法 DQN 解決 CartPole 問題，代碼逐條詳解

本文內容源自百度強化學習 7 日入門課程學習整理感謝百度 PARL 團隊李科澆老師的課程講解強化學習算法 DQN 解決 CartPole 問題，移動小車使得車上的擺杆保持直立。這個遊戲環境可以說是強化學習中的 “He

2020-06-25 23:57:25

原创 C# 的類定義，構造函數和析構函數（學習心得 18）

類，相當於一個數據類型的藍圖。一、類的定義關鍵字 class 開始，形式如下： <access specifier> class class_name { // member variables <acces

2020-06-25 23:57:25

1

原创 C# 的數組定義，訪問，及相關方法彙總（學習心得 14）

一個存儲相同類型元素的固定大小的順序集合。文章目錄一、聲明數組二、初始化數組三、數組賦值3.1 初始化後，利用索引賦值3.2 聲明的同時賦值3.3 初始化的同時賦值3.4 省略數組大小3.5 把一個數組賦值給另一個數組四、訪問數

2020-06-25 23:57:25

2

原创 C# 枚舉 enum（學習心得 17）

枚舉是一組命名整型常量。枚舉類型是使用 enum 關鍵字聲明的。 C# 枚舉是值類型。枚舉包含自己的值，且不能繼承或傳遞繼承。聲明： enum <enum_name> { enumeration list };

2020-06-25 23:57:25

1

原创強化學習算法 DDPG 解決 CartPole 問題，代碼逐條詳解

原创強化學習算法 Sarsa 解迷宮遊戲，代碼逐條詳解

原创強化學習算法 Policy Gradient 解決 CartPole 問題，代碼逐條詳解

原创 Latex 約等於

原创 C# 方法的定義，調用，和參數傳遞（學習心得 12）

原创 Latex 字體加粗

原创強化學習入門（一）強化學習的基礎概念及Gym庫，Parl庫介紹

原创 LaTex 底標

原创強化學習算法 DQN 解決 CartPole 問題，代碼逐條詳解

原创 C# 的類定義，構造函數和析構函數（學習心得 18）

原创 C# 的數組定義，訪問，及相關方法彙總（學習心得 14）

原创 C# 枚舉 enum（學習心得 17）

原创 C# 的可空類型（Nullable），單問號，雙問號（學習心得 13）

原创強化學習入門（四）策略梯度方法 Policy Gradient 求解強化學習問題

原创強化學習入門（三）將神經網絡引入強化學習，經典算法 DQN