Bayesian Optimization with a Finite Budget: An Approximate Dynamic Programming Approach

原創

2020-06-22 11:32

文章目錄

Lam R, Willcox K, Wolpert D H, et al. Bayesian Optimization with a Finite Budget: An Approximate Dynamic Programming Approach[C]. neural information processing systems, 2016: 883-891.

@article{lam2016bayesian,
title={Bayesian Optimization with a Finite Budget: An Approximate Dynamic Programming Approach},
author={Lam, Remi and Willcox, Karen and Wolpert, David H},
pages={883–891},
year={2016}}

概

貝葉斯優化中的多步優化策略. 像經典的EI方法, 就是隻考慮一步, 即希望找到
$r(\mathcal{S}_k, x_{k+1},f_{k+1})=\max \{0, f_{min}^{\mathcal{S}_k}-f_{k+1}\}$
的期望收益最大化的點 $x_{k+1}$ 爲下一個評估點.

上式中的 $f_{min}^{\mathcal{S}_k}$ 是指目標函數在集合 $\mathcal{S}_k$ 上的最小值.

主要內容

考慮如下動態規劃, 第k步的
狀態: $\mathcal{S}_k$ , 即觀測到的點;
控制: $u_k$ , 且 $u_k(\mathcal{S}_k)=x_{k+1}$
擾動: $w_k:=f_{k+1} \sim p(f(x_{k+1})|\mathcal{S}_k)$ ;

設狀態轉移爲:
$\mathcal{S}_{k+1} = \mathcal{F}_k (\mathcal{S}_{k}, x_{k+1}, f_{k+1}) = \mathcal{S}_{k}\cup \{(x_{k+1}, f_{k+1})\}.$

收益(效用函數):
$U_k(x_{k+1}; \mathcal{S} _k) = \mathbb{E}_{w_k}[r_k(\mathcal{S}_k, x_{k+1}, f_{k+1})+J_{k+1}(\mathcal{F}_k (\mathcal{S}_{k}, x_{k+1}, f_{k+1}))], \\ J_k(x_{k+1}) = \max_{x_{k+1}} U_k,\\ J_N=r_N(x_{N+1}).$

很自然的想法是, 我們最大化 $U_1$ , 來獲得所需的評估點, 但是問題是, 這個是一個嵌套的最大化優化問題，不易求解.

本文采用rollout 算法來估計 $U_k$ , 具體如下:

給定基本的決策控制 $\pi = (\pi_1, \ldots, \pi_N)$ (比如最大化EI), 爲了最優化 $U_k$ , 我們先選擇用 $H_{k+1}$ 估計 $J_{k+1}$ , 其定義如下:

其中 $n \in \{k+1, \ldots, N-1\}$ , $\gamma \in [0, 1]$ 用以調節增量.

$H_n$ 是一個期望, 可以用Gauss-Hermite正交化估計:

其中 $\tilde{N} = \min \{k+h, N\}$ , 用以限制最大的估計步數, $\alpha^{(q)}$ 是正交係數, $f_{n+1}^{(q)}$ 是Hermite多項式的根(大概).

於是, $U_k(x_{k+1},\mathcal{S}_k)$ 便可用下式估計:

算法如下:

Input: $h, \gamma, N, \mathcal{S}_1$ ;
repeat N:

根據(20）近似最大化 $U_k$
更新 $\mathcal{S}_{k+1}=\mathcal{S}_k \cup \{(x_{k+1},f_{k+1})\}$

out: $f_{min}^{S_{N+1}}$ .

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Bayesian Optimization with a Finite Budget: An Approximate Dynamic Programming Approach

文章目錄

概

主要內容

藍橋15屆stema編程題密碼鎖-動態規劃 C++和Python最後一道題

2021看雪SDC議題回顧 | SaTC：一種全新的物聯網設備漏洞自動化挖掘方法

C# 代碼學習

Kafka存儲機制

aws語音呼叫調用，告警電話

【轉】[C#] WebAPI 防止併發調用二（冥等性）

一個簡單的MD5加鹽

HTTP URL 詳解

得物 ZooKeeper SLA 也可以 99.99%

創新工具：2024年開發者必備的一款表格控件（二）

Max-Mahalanobis Linear Discriminant Analysis Networks

KKT (LICQ)

Differential Evolution: A Survey of the State-of-the-Art

Bayesian Optimization with a Finite Budget: An Approximate Dynamic Programming Approach

Geometric GAN

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結