人工智能教程 - 專業選修課程4.3.5 - 強化學習 11.價值迭代,預測和控制問題解決方案彙總

最優化原則

Principle of Optimality

在這裏插入圖片描述

價值迭代的定義

Value Iteration
在這裏插入圖片描述

反覆的迭代的過程。

最短路徑的例子

在這裏插入圖片描述

此類情況是在不知道終點在哪兒的情況。 從初始狀態0開始出發,逐步擴散迭代直到找到最短路徑。

在這裏插入圖片描述

在這裏插入圖片描述

預測和控制問題解決方案彙總

在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章