原创 C++多線程編程

注:不要生磕博客,找水平最適合你的,記得目的是解決問題(付出儘量少的時間),而不是摳細節的全面學習。 一、對線程的理解 基本概念: 1. 進程:可以理解成一個運行中的應用程序,是系統進行資源分配和調度的基本單位,是操作系統結構的基礎

原创 問題界定的方法

參考傳送們:https://blog.csdn.net/m0_37468171/article/details/95683365 機器學習一般用來解決哪些方面的問題? 點贊 收藏 分享 文章舉報

原创 深度強化學習進階2:Science 子刊ANYmal

 注:監督學習是人指導機器認知/理解世界本質/特徵。無監督學習是機器自己去認知世界本質。 深度強化學習是在機器自己去學習如何認識世界、如何與世界交互。 從人介入程度、類人智慧程度上,無疑深度強化學習更深一層。 問題一:神經網絡如何設計

原创 改了一個step函數

def get_env_feedback(S, A): # This is how agent will interact with the environment if A == 'right':

原创 2019 AI避虛向實 2020 AI落地清晰

梳理19年AI大事件,評估20年AI落地趨勢 參考鏈接:https://xueqiu.com/6942182748/138411530  2019年AI產業激動人心,2020年AI產業大“浪”滔天 點贊 收藏 分享

原创 C盤瘦身

如何查看文件夾的大小 ,alt加雙擊。 C:\Users\用戶名 文件下的空間佔用主要是AppData和Document兩個文件夾 C:\Users\用戶名\AppData裏面一般有三個文件夾,分別是Local,LocalLow,Roa

原创 從機器學習看本科控制理論(自動化專業)

一、基礎控制理論 1、開設課程:自控、現控、過控、運控、計控、智控。 2、課程內容簡述, 自控:主要研究SISO線性定常系統控制。分析方法:頻率特性、根軌跡法。數學工具:微分方程,傳遞函數,忽略初始條件。 現控:主要研究MIMO非線性時變

原创 變阻抗控制理論基礎、公式推導

注:..代表省略了一些符號 1、機器人建模:在人機交互環境中,機器人歐拉-拉普拉斯動態可以表示爲: q關節角向量,M慣性矩陣,C向心力和科氏力扭矩,G重力向量,D粘性摩擦力,控制輸入,環境力/交互力(contact) 用彈簧-阻尼-質量

原创 深度強化學習篇2:從Playing Atari with Deep Reinforcement Learning 看神經網絡的輸入,學習的狀態空間

Introduction:學習直接從高維的感觀輸入(視覺,語音)去直接控制智能體是強化學習一個長期的挑戰。一些成功的RL應用都是依賴於hand-crafted的特徵。最近深度學習的進步使提取高水平的特徵成爲了可能。 參考傳送門:https

原创 李羣、李代數等數學概念

Question:設函數T = transl(x,y,z),創建SE3平移變換。H = transl (0.5 0 0) = ? SE3變換的目的是什麼? 解:三維齊次矩陣  ,x軸平移0.5。        目的:在配置空間用齊次矩陣求

原创 深度強化學習進階1:模式識別與數據降維

楔子:讀萬卷書與行萬里路。不讀書弱於方法論,行路如同看熱鬧。 不行路弱於感性認識, 讀書一知半解很難深入。 一、模式識別  模式識別 = 特徵(本質)分類 模式識別:對待識別對象的原始信息,根據實際需求提取特徵向量,並設計分類器。

原创 神經網絡與強化學習

一、DQN的神經網絡是怎樣一種結構?有幾層?什麼作用?如何實現數據的記憶?如何做一些改進 (一)問題描述: qu1. 問題複雜度提高導致無法使用Q表記錄全部狀態:        1. 對狀態的維度進行壓縮,解決方案之一Value Fun

原创 軟件開發篇2:MFC庫與C++代碼生成

一、CString庫的使用 1. MFC CString類庫的典型實例 #include <afx.h> //包含MFC CString類庫 #include <iostream> using namespace std;

原创 Matlab環境與Simulink環境下外部函數代碼生成問題

首先!matlab外部函數 help文檔:https://ww2.mathworks.cn/help/simulink/ug/calling-matlab-functions.html 其次,help文檔部分內容不夠詳細,這裏做一些測試。