Evaluation and Control -評估和控制

評估

  • 估計/預測一個給定策略的獎勵期望。

在強化學習中,我們可以脫離策略實現對它的評估。這意味着我們可以使用從其他策略收集到的數據來評估一些反直覺的不同的策略會怎樣做。這非常有用,因爲我們不需要以測試的方式窮盡所有的策略。

控制

  • 最優化:找到最佳的策略。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章