決策論——後悔準則

策略:

  • 每種環境下,算出與該環境下最大值的差值
  • 找出每種策略在不同環境下的最大差值
  • 在這些最大值之中找到最小值

解析:

  • 每種環境下都有好壞
  • 採用不通策略也有好壞
  • 怎麼評價好壞:採取了某個策略,不想與最好的情況相差太遠,這樣不至於過於後悔

缺點:

  • 沒有考慮基值得大小,而只考慮差值
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章