原创 Reinforce learning: Lecture 1 Introduction to Reinforcement Learning 學習筆記
強化學習是什麼? 首先我們先從一個簡單的例子開始,大家都知道,當我們剛出生時,對地球的重力規則肯定是一無所知的,但經過摸爬滾打,我們慢慢地學會了走路,這一過程可以簡化表示爲:我們和地面經過多次的交互,增強了我們的能力。 強化學習主
原创 python基礎之多線程
多線程 點贊 收藏 分享 文章舉報 imcl 發佈了32 篇原創文章 · 獲贊 5 · 訪問量 1萬+ 私信 關注
原创 python基礎之文件讀寫
python文件讀寫 python程序的輸入主要有兩種,一種是通過命令行輸入,另一種是通過文件進行輸入。在大規模參數情況下,第二種方式輸入相比於第一種顯得方便而易行。因此,本文主要記錄下如何對文件進行讀寫操作。 常見文件操作函數
原创 pytorch
這裏寫自定義目錄標題Pytorch Pytorch ‘‘RuntimeError: grad can be implicitly created only for scalar outputs’’ 表明你的loss不是標量
原创 Tensorflow-keras
導入tf.keras import tensorflow as tf import tensorflow.keras as keras if __name__ == '__main__': print(tf.__version__
原创 PER
DDQN-PER tutorial Tree data DQN
原创 fast dataloader
添加鏈接描述 添加鏈接描述
原创 loadsave
load and save model
原创 GAN
GAN
原创 init model parameter
init model parameter example
原创 flownet2 install
flow net2 install
原创 seq to seq
blog: seq to seq
原创 計算機算法設計與分析學習筆記1
基本概念 程序 = 算法 + 數據結構 算法描述如何解決一類問題的一種方法,滿足如下性質: -輸入:一類問題的實例 - 輸出:針對實例的解 - 確定性:每條指令無歧義 - 有限性:有限循環 程序 不滿足有限性性質, eg. 操
原创 collections
前言 namedtuple deque Counter OrderedDict defaultdict Reference 前言 除了python自帶的數據容器,str, dict, list, set, tuple, 我們