Dual Gradient Descent
在guided policy search算法中使用了对偶梯度下降法,但是一直没找到较好的参考资料。这里找到了一份PPT讲解,很清楚,有几何含义的解释。
文档链接:https://pan.baidu.com/s/16Xo6jpe00KEuAGeuyfiIqg
提取码:kmma
可以扫码查看文档:
在guided policy search算法中使用了对偶梯度下降法,但是一直没找到较好的参考资料。这里找到了一份PPT讲解,很清楚,有几何含义的解释。
文档链接:https://pan.baidu.com/s/16Xo6jpe00KEuAGeuyfiIqg
提取码:kmma
可以扫码查看文档:
1.泛函數的幾何意義 2.共軛函數的幾何意義 3.凸函數的局部最優解就是全局最優解 4.最優解的判斷準則證明 5.無約束二次規劃解討論 6.分離超平面定理