二階矩方法

二階矩,方差,切比雪夫不等式

我們可以驗證如果兩個隨機變量\(X,Y\)是獨立的,那麼一定滿足\(E[X\cdot Y]=E[X] \cdot E[Y]\)。只需根據定義把右側表示出來,\(E[X] \cdot E[Y]\)\(=\left(\sum\limits_{x}x\Pr[X=x]\right)\left(\sum\limits_{y}y\Pr[Y=y]\right)\)\(=\sum\limits_{x}\sum\limits_{y}xy\Pr[X=x]\Pr[Y=y]\),根據獨立的定義\(\Pr[X=x]\cdot \Pr[Y=y]=\Pr[X=x \and Y=y]\),因此寫出\(\sum\limits_{x}\sum\limits_{y}xy\Pr[X=x \and Y=y]\),我們轉而枚舉\(x\cdot y\),對於每個確定的\(x\cdot y\),我們需要把所有\(\Pr[X=x \and Y=y]\)累加起來,而這得到的就是\(\Pr[X\cdot Y=x\cdot y]\)(充分必要),這樣就寫出\(\sum\limits_{k}k\Pr[X\cdot Y=k]\),這就是\(E[X \cdot Y]\)的定義本身了。證畢。而當它們不獨立時,容易舉出反例說明這是不滿足的。

對於任意的隨機變量\(X\),就稱\(E[X^2]\)\(X\)的二階矩。注意到\(E[X^2]\neq (E[X])^2\),例如在\(\{1,99\}\)裏選一個數,這構成隨機變量\(X\)。而\(E[X^2]=\sum\limits_{i=1}^{99}i^2 \Pr(X=i)\)\(=\dfrac{\sum\limits_{i=1}^{99}i^2}{99}=\dfrac{9950}{3}\)。而\((E[X])^2=\left(\sum\limits_{i=1}^{99}\dfrac{i}{99}\right)^2=2500\)

於是我們定義\(X\)的方差\(Var[X]=E[X^2]-(E[X])^2\)。即方差等於二階矩減去期望的平方。根據期望的線性性,我們可以驗證\(Var[X]=E[(X-E[X])^2]\)與此等價,因爲\(E[X^2+(E[X])^2-2XE[X]]=E[X^2]+(E[X])^2-2E[X]E[X]\)\(=E[X^2]-(E[X])^2\)。通過後者,我們容易看到方差反應的是隨機變量與期望的偏離程度。比如當隨機變量恆爲\(E[X]\)時,方差爲0。而如果隨機變量有比較大的波動,則\(Var[X]\)也會較大。

我們可以直接驗證\(Var[X+Y]=E[(X+Y)^2]-(E[X+Y])^2\),根據期望的線性性展開可得\(Var[X+Y]=E[X^2]+E[Y^2]+2E[X\cdot Y]-E[X]^2-\)\(E[Y]^2\)\(-2E[X]E[Y]\)\(=Var[X]+Var[Y]+2E[X \cdot Y]-2E[X]E[Y]\)。所以我們看到,只有當\(X,Y\)獨立時我們消去後面的項得到\(Var[X+Y]=Var[X]+Var[Y]\)。這說明當隨機變量獨立時方差也具有線性性。

現在,我們希望能夠定量地描述“方差反應波動性”這一事實。這就是著名的切比雪夫不等式,它指出\(\forall a>0\)\(\Pr[|X-E[X]| \geq a] \leq \dfrac{Var[X]}{a^2}\)。對於任意fix的一個\(a\),方差越大隨機變量偏離\(E[X]\)超過\(a\)的概率越大。而它其實本質上只是Markov不等式——我們可以直接根據Markov不等式得到\(\Pr[|X-E[X]|\geq a]\)\(=\Pr[(X-E[X])^2\geq a^2]\leq \dfrac{E[(X-E[X])^2]}{a^2}=\dfrac{Var[X]}{a^2}\)

考慮值域爲\([0,n]\)中的整數的一個隨機變量\(X\)。如果要證明\(n \to +\infty\)\(\Pr[X=0]\to 1\),只需證明\(\Pr[X\geq 1] \to 0\),根據Markov不等式只需證明\(E[X] \to 0\)。但這個方法卻不能倒過來使用,如果\(E[X] \to +\infty\),不能保證\(\Pr[X \geq 1] \to 1\),所以也無法推出\(\Pr[X=0] \to 0\)。此時可以用切比雪夫不等式,\(\Pr[X=0] \leq \Pr[|X-E[X| \geq E[X]]\leq \dfrac{Var[X]}{(E[X])^2}\)\(=\dfrac{E[X^2]-(E[X])^2}{(E[X])^2}\),因此只需證明\(\lim E[X^2]=\lim (E[X])^2\)即可。這樣我們就找到了一個證明方法了。

隨機圖上的相變

我們已經知道給定頂點個數\(n\)和一個實數\(p \in [0,1]\)就可以隨機生成一張圖。現在我們假設\(p\)是由頂點個數決定的一個函數\(p(n)\)。這樣生成的隨機圖記爲\(G(n,p(n))\)。如果存在一個關於\(n\)的函數\(r(n)\)滿足,當\(p(n) \ll r(n)\)時圖的“某個性質”成立的概率在\(n \to +\infty\)時趨向0,而當\(p(n) \gg r(n)\)時圖的這個性質成立的概率在\(n \to +\infty\)時趨向1,那麼就說圖的這個性質是“具有相變性”的。其中\(r(n)\)就被稱爲圖的這個性質的閾值函數。

下面我們來證明,“包含一個大小爲4的完全圖”這一性質是有相變性的。

設隨機變量\(X\)表示\(K_4\)的數量,那麼性質成立對應事件\(X \geq 1\)。根據Markov不等式\(\Pr[X \geq 1]\leq E[X]\)。根據期望的線性性,我們枚舉所有的大小爲\(4\)的點集累加它們是完全圖的概率,得到\(E[X]=\dbinom{n}{4}\cdot p^{\binom{4}{2}}=\dfrac{n!}{4!(n-4)!}p^6 \leq n(n-1)(n-2)(n-3)p^6 \leq n^4p^6\)。當\(n \to +\infty\)時,爲了使它趨向0,可以取\(r(n)=n^{-\frac{2}{3}}\)

接下來我們來驗證\(r(n)=n^{-\frac{2}{3}}\)也能滿足\(p(n) \gg r(n)\)的情況。根據切比雪夫不等式,\(\Pr[X=0] \leq \Pr[|X-E[X| \geq E[X]]\leq \dfrac{Var[X]}{(E[X])^2}=\dfrac{E[X^2]-(E[X])^2}{(E[X])^2}\)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章