原创 #1_《Qt5編程入門教程》摘錄

文章目錄1. 認識Qt1.1. Qt的安裝目錄1.2. Qt自身的開發工具鏈1.3. 命令行開發1.4. Qt Creator的使用技巧1.4.1. 快捷鍵1.4.2. 善用Qt幫助1.5. 一些細碎的知識2. Qt項目結構2.1

原创 Unity3D學習筆記#5_Unity3D再次概覽(更全面一點)

文章目錄一、Unity認識再次補充①Unity的地位和模型支持②Unity項目發佈到PC平臺的方法③Unity軟件界面補充介紹二、動態GUI和動態GameObject①動態遊戲對象②動態GUI③小例子三、GUI系統①OnGUI系統

原创 Unity3D學習筆記#3_Unity3D的常用對象和組件

文章目錄1. 地形系統 Terrain2. 綜合實驗一3. Rigidbody組件4. 物理材質5. 角色控制 Animation組件6. AR項目參考文獻 本文內容參考b站視頻1。 本文只是提綱挈領的,一定要多點點畫畫,自己摸

原创 Unity3D學習筆記#1_認識Unity3D

文章目錄1. 介紹2. 安裝3. 基本使用3.1. 項目結構3.2. 菜單的一些知識點3.3. 面板相關的知識點參考文獻 本篇對應教程1中的P1~P7,介紹Unity最基礎的知識。 1. 介紹 Unity3D用途:遊戲、視景仿真

原创 [歸納]強化學習導論 - 第十二章:資格跡

文章目錄1. 本章內容概要2. $\lambda$-return3. TD($\lambda$)4. n-step截斷$\lambda$-return方法5. 重新更新:在線$\lambda$-return算法6. 真正的在線TD

原创 #2_經典控制理論梳理和有趣的想法

文章目錄一、總體經典控制理論中時域與頻域分析差別二、時域根軌跡法控制器設計三、頻域Bode圖穩定性判據的理解Bode圖穩定裕度的理解Bode圖控制器設計超前補償滯後補償超前-滯後調節開環Bode圖對系統性能的反應閉環Bode圖對系

原创 #1_《經典控制理論複習》摘錄

文章目錄1. 基本概念2. 線性系統2.1. 傳遞函數2.2. 穩定性2.3. 穩態誤差2.4. 時域設計指標3. 時域控制方法3.1. PID控制3.2. Root Locus4. 頻域控制方法4.1. 基本概念4.2. Bod

原创 [歸納]強化學習導論 - 第三章:有限馬爾可夫過程

文章目錄1.本章內容概要2.智能體-環境接口3.目標和回報4.returns和episodes5.episodic和continuing任務的統一表示6.策略和值函數值函數的迭代關係7.最優策略和最優值函數8.最優性和擬合器9.總

原创 [歸納]強化學習導論 - 第七章:n-step自舉(Bootstrapping)

文章目錄1.本章內容概要2.n-step TD預測3.n-step Sarsa4.n-step off-policy學習5.*帶控制變量的per-decision方法6.無重要性採樣的off-policy學習:n-step樹bac

原创 [歸納]強化學習導論 - 第一章:介紹

文章目錄1.開啓本系列目的2.本書框架3.認識強化學習4.一些可應用強化學習的場景5.強化學習的基本概念5.與進化算法對比6.一個具體的例子:Tic-Tac-Toe7.總結8.附:致歉參考文獻 1.開啓本系列目的 最近開始閱讀Su

原创 [歸納]強化學習導論 - 第四章:動態規劃

文章目錄1.本章內容概要2.策略評估(預測)3.策略提升4.策略迭代5.值迭代6.異步動態規劃7.廣義策略迭代8.動態規劃的有效性9.總結參考文獻 1.本章內容概要 動態規劃(Dynamic Programming, DP)是在完

原创 [歸納]強化學習導論 - 第二章:多臂賭博機

文章目錄1.本章內容概要2.k-臂賭博機問題3.動作值方法4.10臂賭博機實驗5.增量實現6.非平穩情況的處理7.保證探索 - 樂觀初值方法8.保證探索 - 基於上置信界的動作選擇9.梯度賭博機算法10.多狀態賭博機11.總結參考

原创 [歸納]強化學習導論 - 第五章:蒙特卡洛方法

文章目錄1.本章內容概要2.蒙特卡洛預測3.動作值的蒙特卡洛估計4.蒙特卡洛控制5.無探索性起點的蒙特卡洛控制6.基於重要性採樣的off-policy預測7.增量實現8.off-policy的蒙特卡洛控制9.*Discountin

原创 工作啦!

我覺得還是得寫點什麼。 受到疫情影響,經過漫長的等待,終於收到了入職通知,現在已經是我在員工宿舍的第二天了,目前的時間是早晨六點多。不得不說,這份工作的強度確實是比較大的,所以現在必須要努力地去調整自己,適應這種節奏的工作生活,同

原创 [強化學習代碼筆記]Python複習

文章目錄Python複習1. 介紹2. 編寫規範3. 基本語法一切都是對象查看幫助空/否定保留字asassertdeltry...except...finallyglobalgotoinislambdanonlocal和閉包rai