實現softmax
pytorch的基礎學習:
下面給一個例子:
x = torch.ones(4,4) 這個我們通過鏈式求導法則,可以反向推導就知道了,d(out)/d(x) = 1/2 *y = 1.5
默認是忽略梯度。
碎碎念:達叔說 邏輯迴歸相當於小型的神經網絡 就是沒有隱含層嘛 先簡單介紹一下需要做的事情 共分爲7步,接下來將達叔作業裏的所有程序 粘貼出來 1.,導入數據集,查看數據格式 操作:train_set_x_orig, train_set
強化學習 主要參考西瓜書和一些網上視頻加上個人理解,歡迎互動。 強化學習的model如下圖所示,機器在當前狀態下做出動作a,然後環境反饋給機器下一個狀態和一個獎勵。 假定狀態空間X,每一個狀態x∈X,動作空間A,每一個動作a∈A,獎