Hoeffding不等式證明見Hoeffding不等式證
鞅的定義:
一個隨機過程{Zn,n≥1},若對一切n有
E[∣Zn∣]<∞
且
E[Zn+1∣Z1,⋯,Zn]=Zn
鞅是公平博弈的廣義版本。若我們將Zn解釋爲一個賭徒經過n輪公平博弈後得到的財產爲Zn,則下一次賭博得到的財產Zn+1期望等於Zn而不管前面發生了什麼
例子:Xi是均值爲0的獨立同分布變量,Sn=∑i=1nXi爲一個鞅
在介紹Azuma不等式前,先介紹一個引理
引理1:隨機變量X有E[X]=0且P{−α≤X≤β}=1則對任意凸函數有
E[f(X)]≤α+ββf(−α)+α+βαf(β)
證明:由凸函數的定義,∀γ∈[0,1],x,y爲定義域中的點,有
f(γx+(1−γ)y)≤γf(x)+(1−γ)f(y)
即可得到
引理2 對0≤θ≤1有
θe(1−θ)x+(1−θ)e−θx≤ex2/8
證明:令θ=(1+α)/2,x=2β,則相當於證明對−1≤α≤1有
(1+α)eβ(1−α)+(1−α)e−β(1+α)≤2eβ2/2
等價於
eβ+e−β+α(eβ−e−β)≤2exp{αβ+β2/2}
當α=±1或者β足夠大,比如β≥100時,不等式顯然成立
所以如果不等式不成立,則函數
f(α,β)=eβ+e−β+α(eβ−e−β)−2exp{αβ+β2/2}
在區域R={(α,β)∣∣α∣<1,∣β∣<100}存在一個正的最大值。這時候梯度爲0,令f的偏導爲0,得到
eβ−e−β+α(eβ+e−β)=2(α+β)exp{αβ+β2/2}eβ−e−β=2βexp{αβ+β2/2}
如果存在一個解β=0,則上面兩式相除得
1+αeβ−e−βeβ+e−β=1+βα
當α=0
eβ−e−β=2βexp{β2/2}
這個沒有非零解,因爲如果有解,則解β>0,否則左邊小於0
而函數
f(x)=2xe22/2+e−x−ex>0,∀x>0
它蘊含於不等式(求導,然後省略項)
ex2/2>2ex+e−x
這個可以用泰勒展開證明(其他方式證明見江大橋的證明)
ex2/2=1+k=1∑∞2k(k!)x2k
2ex+e−x=1+k=1∑∞(2k)!x2k
顯然左邊大於右邊
所以不存在α=0,β=0的解
如果α=0,化簡得
β(eβ+e−β)=eβ−e−β
我們可以證明上面等式除了β=0沒有解
因爲相當於證明
(1−β)e2β−(1+β)=0
沒有非0解。 如果上面有其他解,則首先解β∈(−1,1),而函數(1−x)e2x−(1+x)在x∈(−1,1)嚴格遞減(由1+x≤ex可得),故至多一個解,顯然矛盾。
所以f(α,β)在f(α,0)=0取得最大值,產生了矛盾,即沒有正解,原不等式恆成立。
Azuma不等式
令Zn爲一個均值爲μ的鞅,令Z0=μ且假設對非負參數αi,βi有
−αi≤Zi−Zi−1≤βi,對任意n>0,a>0,有
P{Zn−μ≥a}≤exp{−2a2/i=1∑n(αi+βi)2}
P{Zn−μ≤−a}≤exp{−2a2/i=1∑n(αi+βi)2}
證明:先假設μ=0,對任意c>0有
P(Zn≥a)=P(exp{cZn}≥expca)≤E[exp{cZn}]e−ca(MarkovinequalityP(∣X∣≥a)≤E[∣X∣]/a)∗∗∗
爲了得到E[exp{cZn}]的上界,令Wn=exp{cZn}
注意到W0=1,且Wn=exp{cZn−1}exp{c(Zn−Zn−1)}
所以
E[Wn∣Zn−1]=exp{cZn−1}E[exp{c(Zn−Zn−1)}∣Zn−1]≤Wn−1(βnexp−cαn+αnexpcβn)/(αn+βn)
最後一步由上面引理1得到
f(x)=ecx是凸函數
−αn≤Zn−Zn−1≤βn
E[Zn−Zn−1∣Zn−1]=E[Zn∣Zn−1]−E[Zn−1∣Zn−1]=0
對上邊兩邊取期望(對Zn−1),得到
E[Wn]≤E[Wn−1](βnexp−cαn+αnexpcβn)/(αn+βn)
連續使用上面的不等式,由E[W0]=1遞推得到
E[Wn]≤i=1∏n{(βiexp−cαi+αiexpcβi)/(αi+βi)}
由上面***式和引理2,得到
P{Zn≥a}≤e−cai=1∏n{(βiexp−cαi+αiexpcβi)/(αi+βi)}≤e−cai=1∏nexp{c2(αi+βi)2/8}
上面不等式是在上面取θ=αi/(αi+βi),x=c(αi+βi)應用引理2得到,對任意c>0,得到
P{Zn≥a}≤exp{−ca+c2i=1∑n(αi+βi)2/8}
由於對任意c都有上面不等式成立,我們可以通過取合適的c最小化上面右端,得c=4a/i=1∑n(αi+βi)2
代回去得到
P{Zn≥a}≤exp{−2a2/i=1∑n(αi+βi)2}
上面證明了μ=0時,不等式(1)成立,對於μ=0的情況,取鞅{Sn=Zn−μ}和{Sn=μ−Zn}就分別得到一般情況的(1)和(2)
Hoeffding不等式
上面不等式知道,在滿足Hoeffding條件下,{Sn=∑i=1n(Xi−μi)}是一個均值爲0的鞅,P(Xi∈[αi,βi])=1
對鞅{Sn}應用Azuma不等式就得到Hoeffding不等式