Dual Gradient Descent
在guided policy search算法中使用了對偶梯度下降法,但是一直沒找到較好的參考資料。這裏找到了一份PPT講解,很清楚,有幾何含義的解釋。
文檔鏈接:https://pan.baidu.com/s/16Xo6jpe00KEuAGeuyfiIqg
提取碼:kmma
可以掃碼查看文檔:
在guided policy search算法中使用了對偶梯度下降法,但是一直沒找到較好的參考資料。這裏找到了一份PPT講解,很清楚,有幾何含義的解釋。
文檔鏈接:https://pan.baidu.com/s/16Xo6jpe00KEuAGeuyfiIqg
提取碼:kmma
可以掃碼查看文檔:
1.泛函數的幾何意義 2.共軛函數的幾何意義 3.凸函數的局部最優解就是全局最優解 4.最優解的判斷準則證明 5.無約束二次規劃解討論 6.分離超平面定理