原创 2018UCBerkeley深度強化學習-模擬學習Lec2

課程內容 符號的介紹 模仿學習(imitate learning) 符號 符號含義這裏不再贅述,這裏需要注意的是:state與observation的區別。正如課堂中老師所說: The state is actually t

原创 UCBerkeley 深度強化學習-強化學習簡介Lec4

課程內容 簡介 強化學習算法 幾種強化學習方法的比較 簡介 Part ♡1 MDPS POMDPS(部分可觀測) Part ♡2 其中θ是策π略的參數,強化學習爲了使得在當前狀態st和當前選擇的行爲at的情況下的條件

原创 win10-python3.7通過Anaconda安裝TensorFlow

檢查Python版本 方法一:win+r進入cmd命令 點擊確定,Python版本即可得知: 方法二:在Anaconda Pompt中輸入:python 安裝TensorFlow 找到Tensorflow支持Pytho

原创 **ubantu中安裝setpy.py**

第一步:打開一個terminal,找到你所需要安裝的setup.py的絕對路徑 第二步:在目錄下輸入 python setup.py install terminal zzy@zzy-OptiPlex-9020:~$ cd '/hom