原创 Reinforce learning: Lecture 1 Introduction to Reinforcement Learning 學習筆記

強化學習是什麼? 首先我們先從一個簡單的例子開始,大家都知道,當我們剛出生時,對地球的重力規則肯定是一無所知的,但經過摸爬滾打,我們慢慢地學會了走路,這一過程可以簡化表示爲:我們和地面經過多次的交互,增強了我們的能力。 強化學習主

原创 python基礎之多線程

多線程 點贊 收藏 分享 文章舉報 imcl 發佈了32 篇原創文章 · 獲贊 5 · 訪問量 1萬+ 私信 關注

原创 python基礎之文件讀寫

python文件讀寫 python程序的輸入主要有兩種,一種是通過命令行輸入,另一種是通過文件進行輸入。在大規模參數情況下,第二種方式輸入相比於第一種顯得方便而易行。因此,本文主要記錄下如何對文件進行讀寫操作。 常見文件操作函數

原创 pytorch

這裏寫自定義目錄標題Pytorch Pytorch ‘‘RuntimeError: grad can be implicitly created only for scalar outputs’’ 表明你的loss不是標量

原创 Tensorflow-keras

導入tf.keras import tensorflow as tf import tensorflow.keras as keras if __name__ == '__main__': print(tf.__version__

原创 PER

DDQN-PER tutorial Tree data DQN

原创 fast dataloader

添加鏈接描述 添加鏈接描述

原创 loadsave

load and save model

原创 GAN

GAN

原创 init model parameter

init model parameter example

原创 flownet2 install

flow net2 install

原创 Time series forecasting

AR

原创 seq to seq

blog: seq to seq

原创 計算機算法設計與分析學習筆記1

基本概念 程序 = 算法 + 數據結構 算法描述如何解決一類問題的一種方法,滿足如下性質: -輸入:一類問題的實例 - 輸出:針對實例的解 - 確定性:每條指令無歧義 - 有限性:有限循環 程序 不滿足有限性性質, eg. 操

原创 collections

前言 namedtuple deque Counter OrderedDict defaultdict Reference 前言 除了python自帶的數據容器,str, dict, list, set, tuple, 我們