Azuma不等式和Hoeffding不等式

Hoeffding不等式證明見Hoeffding不等式證
鞅的定義
一個隨機過程{Zn,n1}\{Z_n,n\ge 1\},若對一切nn
E[Zn]<\mathbb{E}[|Z_n|] \lt \infty

E[Zn+1Z1,,Zn]=Zn\mathbb{E}[Z_{n+1} |Z_1,\cdots,Z_n] = Z_n
鞅是公平博弈的廣義版本。若我們將ZnZ_n解釋爲一個賭徒經過nn輪公平博弈後得到的財產爲ZnZ_n,則下一次賭博得到的財產Zn+1Z_{n+1}期望等於ZnZ_n而不管前面發生了什麼

例子:XiX_i是均值爲0的獨立同分布變量,Sn=i=1nXiS_{n}=\sum_{i=1}^n X_i爲一個鞅
在介紹Azuma不等式前,先介紹一個引理

引理1:隨機變量XXE[X]=0\mathbb{E}[X]=0P{αXβ}=1P\{-\alpha \le X \le \beta\} = 1則對任意凸函數有
E[f(X)]βα+βf(α)+αα+βf(β)\mathbb{E}[f(X)] \le \frac{\beta}{\alpha + \beta}f(-\alpha) + \frac{\alpha}{\alpha + \beta}f(\beta)
證明:由凸函數的定義,γ[0,1]\forall \gamma\in [0,1],x,yx,y爲定義域中的點,有
f(γx+(1γ)y)γf(x)+(1γ)f(y)f(\gamma x + (1-\gamma)y) \le \gamma f(x) + (1-\gamma) f(y)
即可得到

引理20θ10\le \theta \le 1
θe(1θ)x+(1θ)eθxex2/8\theta e^{(1-\theta)x} +(1-\theta)e^{-\theta x} \le e^{x^2/8}
證明:令θ=(1+α)/2,x=2β\theta = (1+\alpha) / 2,x=2\beta,則相當於證明對1α1-1\le \alpha\le1
(1+α)eβ(1α)+(1α)eβ(1+α)2eβ2/2(1+\alpha) e^{\beta (1-\alpha)} + (1-\alpha) e^{-\beta(1+\alpha)} \le 2 e^{\beta^2/2}
等價於
eβ+eβ+α(eβeβ)2exp{αβ+β2/2}e^\beta + e^{-\beta} + \alpha(e^\beta - e^{-\beta}) \le 2 \exp\{\alpha\beta + \beta^2 /2\}
α=±1\alpha=\pm 1或者β\beta足夠大,比如β100\beta \ge100時,不等式顯然成立
所以如果不等式不成立,則函數
f(α,β)=eβ+eβ+α(eβeβ)2exp{αβ+β2/2}f(\alpha,\beta)=e^\beta +e^{-\beta} +\alpha(e^\beta - e^{-\beta}) -2\exp\{ \alpha \beta + \beta^2 /2\}
在區域R={(α,β)α<1,β<100}R=\{(\alpha,\beta) | |\alpha| <1,|\beta| < 100 \}存在一個正的最大值。這時候梯度爲0,令ff的偏導爲0,得到
eβeβ+α(eβ+eβ)=2α+βexp{αβ+β2/2}eβeβ=2βexp{αβ+β2/2}\begin{aligned} &e^\beta - e^{-\beta} + \alpha( e^\beta + e^{-\beta})=2(\alpha+\beta)\exp\{\alpha\beta+\beta^2/2\}\\ &e^\beta - e^{-\beta}=2\beta \exp\{\alpha\beta+\beta^2/2\} \end{aligned}
如果存在一個解β0\beta \ne 0,則上面兩式相除得
1+αeβ+eβeβeβ=1+αβ1+\alpha \frac{e^\beta + e^{-\beta}}{e^\beta - e^{-\beta}}=1+\frac{\alpha}{\beta}
α=0\alpha=0
eβeβ=2βexp{β2/2}e^\beta - e^{-\beta}=2\beta \exp\{\beta^2/2\}
這個沒有非零解,因爲如果有解,則解β>0\beta>0,否則左邊小於0
而函數
f(x)=2xe22/2+exex>0,x>0f(x) =2xe^{2^2/2} + e^{-x} -e^x >0,\forall x>0
它蘊含於不等式(求導,然後省略項)
ex2/2>ex+ex2e^{x^2/2}> \frac{e^x+e^{-x}}{2}
這個可以用泰勒展開證明(其他方式證明見江大橋的證明
ex2/2=1+k=1x2k2k(k!)e^{x^2/2} = 1+\sum_{k=1}^\infty \frac{x^{2k}}{2^k(k!)}
ex+ex2=1+k=1x2k(2k)!\frac{e^x+e^{-x}}{2}=1+\sum_{k=1}^\infty \frac{x^{2k}}{(2k)!}
顯然左邊大於右邊
所以不存在α=0,β0\alpha=0,\beta\ne 0的解

如果α0\alpha \ne 0,化簡得
β(eβ+eβ)=eβeβ\beta(e^\beta + e^{-\beta}) = e^\beta - e^{-\beta}
我們可以證明上面等式除了β=0\beta=0沒有解

因爲相當於證明
(1β)e2β(1+β)=0(1-\beta)e^{2\beta} - (1+\beta) =0
沒有非0解。 如果上面有其他解,則首先解β(1,1)\beta \in (-1,1),而函數(1x)e2x(1+x)(1-x)e^{2x} - (1+x)x(1,1)x\in (-1,1)嚴格遞減(由1+xex1+x \le e^x可得),故至多一個解,顯然矛盾。
所以f(α,β)f(\alpha,\beta)f(α,0)=0f(\alpha,0)=0取得最大值,產生了矛盾,即沒有正解,原不等式恆成立。

Azuma不等式
ZnZ_n爲一個均值爲μ\mu的鞅,令Z0=μZ_0=\mu且假設對非負參數αi,βi\alpha_i,\beta_i
αiZiZi1βi-\alpha_i \le Z_i - Z_{i-1} \le \beta_i,對任意n>0,a>0n>0,a>0,有
P{Znμa}exp{2a2/i=1n(αi+βi)2}P\{Z_n - \mu \ge a\} \le \exp \left\{ -2a^2\bigg /\sum_{i=1}^n (\alpha_i+\beta_i)^2 \right\}
P{Znμa}exp{2a2/i=1n(αi+βi)2}P\{Z_n - \mu \le -a\} \le \exp \left\{ -2a^2\bigg /\sum_{i=1}^n (\alpha_i+\beta_i)^2 \right\}
證明:先假設μ=0\mu=0,對任意c>0c>0
P(Zna)=P(exp{cZn}expca)E[exp{cZn}]eca(MarkovinequalityP(Xa)E[X]/a)\begin{aligned} P(Z_n \ge a) &= P(\exp\{cZ_n\} \ge \exp^{ca}) \\ &\le \mathbb{E}[\exp\{cZ_n\}]e^{-ca} \quad(Markov\, inequality P(|X| \ge a) \le \mathbb{E}[|X|]/a) *** \end{aligned}
爲了得到E[exp{cZn}]\mathbb{E}[\exp\{cZ_n\}]的上界,令Wn=exp{cZn}W_n=\exp\{cZ_n\}
注意到W0=1,Wn=exp{cZn1}exp{c(ZnZn1)}W_0 =1,且W_n=\exp\{cZ_{n-1}\}\exp\{c(Z_n - Z_{n-1})\}
所以
E[WnZn1]=exp{cZn1}E[exp{c(ZnZn1)}Zn1]Wn1(βnexpcαn+αnexpcβn)/(αn+βn)\begin{aligned} E[W_n| Z_{n-1}] &= \exp\{cZ_{n-1}\} \mathbb{E}[\exp\{c(Z_n - Z_{n-1})\} |Z_{n-1}]\\ &\le W_{n-1}\left(\beta_n \exp^{-c\alpha_n} + \alpha_n \exp^{c\beta_n}\right) /(\alpha_n + \beta_n) \end{aligned}
最後一步由上面引理1得到

f(x)=ecxf(x) = e^{cx}是凸函數
αnZnZn1βn-\alpha_n\le Z_n - Z_{n-1}\le \beta_n
E[ZnZn1Zn1]=E[ZnZn1]E[Zn1Zn1]=0\mathbb{E}[Z_{n} - Z_{n-1}|Z_{n-1}] = \mathbb{E}[Z_{n}|Z_{n-1}]-\mathbb{E}[Z_{n-1}|Z_{n-1}] = 0

對上邊兩邊取期望(對Zn1Z_{n-1}),得到
E[Wn]E[Wn1](βnexpcαn+αnexpcβn)/(αn+βn)\mathbb{E}[W_n]\le\mathbb{E}[W_{n-1}]\left(\beta_n \exp^{-c\alpha_n} + \alpha_n \exp^{c\beta_n}\right) /(\alpha_n + \beta_n)
連續使用上面的不等式,由E[W0]=1\mathbb{E}[W_0]=1遞推得到
E[Wn]i=1n{(βiexpcαi+αiexpcβi)/(αi+βi)}\mathbb{E}[W_n] \le \prod_{i=1}^n\{\left(\beta_i \exp^{-c\alpha_i} + \alpha_i \exp^{c\beta_i}\right) /(\alpha_i + \beta_i) \}

由上面***式和引理2,得到
P{Zna}ecai=1n{(βiexpcαi+αiexpcβi)/(αi+βi)}ecai=1nexp{c2(αi+βi)2/8}\begin{aligned} P\{Z_n \ge a\} &\le e^{-ca} \prod_{i=1}^n\{\left(\beta_i \exp^{-c\alpha_i} + \alpha_i \exp^{c\beta_i}\right) /(\alpha_i + \beta_i) \} \\ &\le e^{-ca} \prod_{i=1}^n \exp\{c^2(\alpha_i+\beta_i)^2/8\} \end{aligned}
上面不等式是在上面取θ=αi/(αi+βi),x=c(αi+βi)\theta=\alpha_i/(\alpha_i+\beta_i),x = c(\alpha_i + \beta_i)應用引理2得到,對任意c>0c>0,得到
P{Zna}exp{ca+c2i=1n(αi+βi)2/8}P\{Z_n \ge a\} \le \exp\{-ca + c^2\sum_{i=1}^n(\alpha_i + \beta_i)^2/8\}

由於對任意cc都有上面不等式成立,我們可以通過取合適的cc最小化上面右端,得c=4a/i=1n(αi+βi)2c=4a/\sum_{i=1}^n(\alpha_i+\beta_i)^2
代回去得到
P{Zna}exp{2a2/i=1n(αi+βi)2}P\{Z_n \ge a\} \le \exp\{-2a^2 / \sum_{i=1}^n (\alpha_i+\beta_i)^2\}
上面證明了μ=0\mu=0時,不等式(1)成立,對於μ0\mu \ne 0的情況,取鞅{Sn=Znμ}\{Sn = Z_n - \mu\}{Sn=μZn}\{Sn=\mu-Z_n\}就分別得到一般情況的(1)和(2)

Hoeffding不等式

上面不等式知道,在滿足Hoeffding條件下,{Sn=i=1n(Xiμi)}\{S_{n}=\sum_{i=1}^n (X_i - \mu_i)\}是一個均值爲0的鞅,P(Xi[αi,βi])=1P(X_i\in [\alpha_i,\beta_i])=1
對鞅{Sn}\{S_n\}應用Azuma不等式就得到Hoeffding不等式

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章