(概率論與數理統計)ch02

  1. 隨機變量:
    假如一個變量在數軸上的取值依賴於隨機現象的基本結果,則稱此變量爲隨機變量.

  2. 累計概率分佈函數(分佈函數): F(x)=P(Xx)F(x)=P(X\leqslant x)

  3. 可列可加性公理:
    P(n=1An)=n=1P(An)P(\bigcup_{n=1}^{\infty}A_n)=\sum_{n=1}^{\infty}P(A_n)

  4. 二項分佈的期望:Xb(n,p)X\sim b(n,p)
    E(X)=x=0nxCnxpx(1p)nx=npE(X)=\sum_{x=0}^{n}xC_n^xp^x(1-p)^{n-x}=np

  5. 泊松定理:在n重伯努利試驗中,以pnp_n表示在一次實驗中成功發生的概率.且隨着n增大,pnp_n在減小.若nn \rightarrow \infty時,λn=npnλ\lambda_n=np_n \rightarrow \lambda,λ>0\lambda>0.則出現x次成功的概率爲
    Cnxpnx(1pn)nxλxx!eλC_n^xp^x_n(1-p_n)^{n-x} \rightarrow \frac{\lambda^x}{x!}e^{-\lambda}
    證明:
    (nx)pnx(1pn)nx=n(n1)(nx+1)x!(λnn)x(1λnn)nx=λnxx!(11n)(12n)(1x1n)(1λnn)nx\begin{array}{l}\left(\begin{array}{l}n \\ x\end{array}\right) p_{n}^{x}\left(1-p_{n}\right)^{n-x} \\ =\frac{n(n-1) \cdots(n-x+1)}{x !}\left(\frac{\lambda_{n}}{n}\right)^{x}\left(1-\frac{\lambda_{n}}{n}\right)^{n-x} \\ =\frac{\lambda_{n}^{x}}{x !}\left(1-\frac{1}{n}\right)\left(1-\frac{2}{n}\right) \cdots\left(1-\frac{x-1}{n}\right)\left(1-\frac{\lambda_{n}}{n}\right)^{n-x}\end{array}
    注意,又因爲下面的極限成立
    limnλn=λlimn(1λnn)nx=eλ\begin{array}{l}\lim _{n \rightarrow \infty} \lambda_{n}=\lambda \\ \lim _{n \rightarrow \infty}\left(1-\frac{\lambda_{n}}{n}\right)^{n-x}=e^{-\lambda}\end{array}
    所以原式成立.值得注意的是,這個分佈和二項分佈不同之處在於,pnp_n是會變化的.它會取極限.

  6. 泊松分佈:根據泊松定理可得 XP(λ)X\sim P(\lambda)
    x=1λxx!eλ=eλx=1λxx!=eλeλ=1\sum_{x=1}^{\infty}\frac{\lambda^x}{x!}e^{-\lambda}=e^{\lambda}\sum_{x=1}^{\infty}\frac{\lambda^x}{x!}=e^{-\lambda}e^{\lambda}=1
    可見泊松定理推出的一個分佈公式,實際上是一個概率分佈.這個概率分佈是一個典型的離散型分佈.隨機變量取值爲所有非負整數.

  7. 泊松分佈的期望:
    E(X)=x=0xλxx!eλ=λeλx=1λx1(x1)!=λ\begin{aligned} E(X) &=\sum_{x=0}^{\infty} x \cdot \frac{\lambda^{x}}{x !} e^{-\lambda} \\ &=\lambda e^{-\lambda} \sum_{x=1}^{\infty} \frac{\lambda^{x-1}}{(x-1) !}=\lambda \end{aligned}

  8. 泊松分佈,總與計數過程相關聯,並且計數是在一定時間內或一定區域內,或特定單位內的前提下進行的.比如

    • 在一定時間內,電話總站接錯電話的次數;

    • 在一定時間內, 在超市排隊等候付款的顧客人數;

    • 在一定時間內,來到車站等候公共汽車的人數;

    • 在一定時間內, 某操作系統發生故障的次數;

    • 在一個穩定的團體內,活到100歲的人數;

    • 一匹布上,瑕疵點的個數;

    • 100頁書上,錯別字的個數;

    • 一個麪包上,葡萄乾的個數;

  9. 超幾何分佈:N個產品,其中M個次品.如果進行不放回抽樣.那麼如果抽n次,拿到次品數量的概率分佈.h(n,N,M)h(n,N,M)
    P(X=x)=(Mx)(NMnx)(Nn)x=0,1,,r\begin{aligned} P(X=x) &=\frac{\left(\begin{array}{l}M \\ x\end{array}\right)\left(\begin{array}{l}N-M \\ n-x\end{array}\right)}{\left(\begin{array}{l}N \\ n\end{array}\right)} \\ & x=0,1, \cdots, r \end{aligned}
    其中r=min(n,M)r=min(n,M),其中我們可以看到的是
    x=0r(Mx)(NMnx)=(Nn)\sum_{x=0}^{r}\left(\begin{array}{l}M \\ x\end{array}\right)\left(\begin{array}{c}N-M \\ n-x\end{array}\right)=\left(\begin{array}{l}N \\ n\end{array}\right)
    由此可見 x=0rP(X=x)=1\sum_{x=0}^{r}P(X=x)=1

  10. 連續隨機變量的概率密度函數 p(x)0p(x)\geqslant 0
    +p(x)dx=1\int_{-\infty}^{+\infty}{p(x)dx}=1
    P(aXb)=abp(x)dxP(a\leqslant X\leqslant b)=\int_{a}^{b}{p(x)dx}

  11. 均勻分佈 XU(a,b)X\sim U(a,b)

  12. 指數分佈 XExp(λ)X\sim Exp(\lambda)

    p(x)={λeλx,x00,x<0p(x)=\left\{ \begin{aligned} \lambda e^{-\lambda x},x\geqslant 0\\ 0, x<0 \end{aligned} \right. 不少產品首次發生故障的時間T服從指數分佈.

  13. 隨機變量的分佈函數
    F(x)=P(Xx)=xp(x)dxF(x)=P(X\leqslant x)=\int_{-\infty}^{x}{p(x)dx}

    • 均勻分佈 F(x)={0,x<axaba,axb1,x>bF(x)=\left\{ \begin{aligned} 0&, x<a\\ \frac{x-a}{b-a}&,a\leqslant x\leqslant b\\ 1&,x>b \end{aligned} \right.

    • 指數分佈 F(x)={0,x<01eλx,x0F(x)=\left\{ \begin{aligned} 0&, x<0\\ 1-e^{-\lambda x}&,x\geqslant 0 \end{aligned} \right.

  14. 連續隨機變量分佈函數的一些性質

    • F(x)F(x)是連續函數

    • P(X=x)=0P(X=x)=0,零概率事件和不可能事件Φ\varPhi,是有差別的.0️零概率事件不全是不可能事件.同理必然事件的概率爲1.但是概率爲1的事件不全是必然事件.概率爲1的事件實際上是幾乎必然發生的事件.

    • P(aXb)=P(aX<b)=P(a<Xb)=P(a<X<b)\left. \begin{aligned} P(a\leqslant X\leqslant b)&=P(a\leqslant X<b)\\ &=P(a<X\leqslant b)\\ &=P(a<X<b) \end{aligned} \right.

    • F(x)=p(x)F^{'}(x)=p(x)

  15. P(x;p1(x)=p2(x))=1P(x;p_1(x)=p_2(x))=1, 兩個函數在概率論中成爲幾乎處處相等.比如
    p1(x)={1ba,a<xb0, other p_{1}(x)=\left\{\begin{array}{ll}\frac{1}{b-a}, & a<x \leqslant b \\ 0 & , \text { other }\end{array}\right.
    p2(x)={1ba,a<x<b0other,p_{2}(x)=\left\{\begin{array}{ll}\frac{1}{b-a}, & a<x<b \\ 0 & \text{other},\end{array}\right.

  16. 已知隨即變量X的分佈函數FX(x)F_X(x)和密度函數爲pX(x)p_X(x),又設Y=g(x)Y=g(x),其中gg是嚴格單調的函數.且導數g()g^{'}(\cdot)存在.則YY的概率密度函數爲
    pY(y)=pX(h(y))h(y)p_Y(y)=p_X(h(y))|h^{'}(y)| h(y)h(y)
    y=g(x)y=g(x)的反函數,h(y)h^{'}(y)是其導數.
    證明:
    FY(y)=P(Yy)=P(g(X)y)=P(Xh(y))=FX(h(y))pY(y)=pX(h(y))h(y)\begin{aligned} F_{Y}(y) &=P(Y \leqslant y)=P(g(X) \leqslant y) \\ &=P(X \leqslant h(y))=F_{X}(h(y)) \\ p_{Y}(y) &=p_{X}(h(y)) \cdot h^{\prime}(y) \end{aligned}

  17. 均勻分佈的數學期望 E(x)=a+b2E(x)=\frac{a+b}{2}

  18. 指數分佈的期望 E(X)=1λE(X)=\frac{1}{\lambda}

  19. 期望不存在的分佈舉例.柯西分佈
    p(x)=1π(1+x2),<x<p(x)=\frac{1}{\pi (1+x^2)},-\infty<x<\infty 因爲積分,
    1πx1+x2dx\frac{1}{\pi}\int_{-\infty}^{\infty}{\frac{|x|}{1+x^2}dx} 無限.

  20. 正態分佈
    p(x)=12πσExp((xμ)22σ2),<x<p(x)=\frac{1}{\sqrt{2\pi}\sigma}Exp(-\frac{(x-\mu)^2}{2\sigma^2}), -\infty<x<\infty

  21. 正態分佈的例子描述

    • 測量誤差ϵ\epsilon可以用正態分佈描述.

    • 關頭自動包裝上重量y與標準重量m偏差δ\delta服從正態分佈.

    • 大批量製造的東西的尺寸和標準尺寸之差服從正態分佈.

    • 同齡人的身高體重

    • 人的收入

    • 一個地區降雨量

    • 超市出售的雞蛋重量

  22. 正態分佈的應用:

    • 許多分佈可用正態分佈做近似.

    • 從正態分佈中可以導出一些有用的分佈.χ2\chi^2分佈,tt分佈,以及FF分佈.

  23. 正態分佈的期望 E(x)=μE(x)=\mu

  24. 標準正態分佈
    φ(u)=12πExp(u22),<u<.\varphi(u)=\frac{1}{\sqrt{2\pi}}Exp(-\frac{u^2}{2}),-\infty<u<\infty.
    Φ(u)=12πuExp(x22)dx\Phi(u)=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^{u}{Exp(-\frac{x^2}{2})dx}
    Φ(u)=1Φ(u)\Phi(-u)=1-\Phi(u)

  25. 正態分佈的線性變換
    XN(μ,σ2)U=XμσX\sim N(\mu,\sigma^2) \rightarrow U=\frac{X-\mu}{\sigma}

  26. 正態分佈的計算
    F(a<X<b)=Φ(bμσ)Φ(aμσ)F(a<X<b)=\Phi(\frac{b-\mu}{\sigma})-\Phi(\frac{a-\mu}{\sigma})
    P(X<b)=Φ(bμσ)P(X<b)=\Phi(\frac{b-\mu}{\sigma})
    P(X>a)=1Φ(aμσ)P(X>a)=1-\Phi(\frac{a-\mu}{\sigma})

  27. 伽馬函數如下所示
    Γ(α)=0xα1exdx,α>0\Gamma(\alpha)=\int_{0}^{\infty}{x^{\alpha-1}e^{-x}dx},\alpha>0

    • Γ(1)=1,Γ(12)=π\Gamma(1)=1,\Gamma(\frac{1}{2})=\sqrt{\pi}

    • Γ(α+1)=αΓ(α)\Gamma(\alpha+1)=\alpha\Gamma(\alpha),對於自然數有Γ(n+1)=n!\Gamma(n+1)=n!

    • 0xα1eλxdx=Γ(α)/λα\int_{0}^{\infty}{x^{\alpha-1}e^{-\lambda x}dx}=\Gamma(\alpha)/\lambda^{\alpha}

  28. 伽馬分佈的概率密度函數,XGa(α,λ)X\sim Ga(\alpha,\lambda) p(x)={λαΓ(α)xα1eλx,x>00,x0p(x)=\left\{ \begin{aligned} &\frac{\lambda^{\alpha}}{\Gamma(\alpha)}x^{\alpha-1}e^{\lambda x}&, x>0\\ &0&, x\leqslant 0 \end{aligned} \right. 其中α>0\alpha>0稱爲形狀參數,λ>0\lambda>0稱爲尺度函數.

  29. 伽馬分佈的數學期望爲 E(x)=αλE(x)=\frac{\alpha}{\lambda}

  30. α=1\alpha=1的伽馬分佈就是指數分佈.

  31. 指數分佈XExp(λ)X\sim Exp(\lambda)無記憶性 P(X>s+tX>s)=P(X>t)P(X>s+t|X>s)=P(X>t)

  32. λ=12\lambda=\frac{1}{2},
    α=n2\alpha=\frac{n}{2}的伽馬分佈稱爲自由度爲n的χ2\chi^2分佈.Xχ2X\sim \chi^2
    E(x)=n=αλE(x)=n=\frac{\alpha}{\lambda}
    p(x)=1Γ(n2)2n/2xn21ex2,x>0p(x)=\frac{1}{\Gamma(\frac{n}{2})2^{n/2}}x^{\frac{n}{2}-1}e^{-\frac{x}{2}},x>0

  33. 貝塔函數
    β(a,b)=01fdxxn1(1x)b1dx,a>0,b>0\beta(a,b)=\int_{0}^{1}{fdx}x^{n-1}(1-x)^{b-1}dx,a>0,b>0

    • β(a,b)=β(b,a)\beta(a,b)=\beta(b,a)

    • β(a,b)=Γ(a)Γ(b)Γ(a+b)\beta(a,b)=\frac{\Gamma(a)\Gamma(b)}{\Gamma(a+b)}

  34. 貝塔分佈的,概率密度函數,XBe(a,b)X\sim Be(a,b)
    p(x)=Γ(a+b)Γ(a)Γ(b)xa1(1x)b1,0x1p(x)=\frac{\Gamma(a+b)}{\Gamma(a)\Gamma(b)}x^{a-1}(1-x)^{b-1},0\leqslant x\leqslant 1
    其中a,b都是形狀參數,且都爲正.

    • 不合格率,服從它

    • 機器維修率

    • 打靶命中率

    • 市場佔有率

    也就是說各種比率,的話.它們一般服從beta分佈.

  35. beta分佈的數學期望 E(x)=aa+bE(x)=\frac{a}{a+b}

  36. a=b=1a=b=1的beta分佈實際上就是[0,1][0,1]上的均勻分佈.

  37. 設隨機變量X以及其函數g(X)的數學期望都存在.那麼 E[g(X)]={ig(xi)p(xi)g(x)p(x)dxE[g(X)]=\left\{ \begin{aligned} \sum_ig(x_i)p(x_i)\\ \int_{-\infty}^{\infty}{g(x)p(x)dx} \end{aligned} \right.

  38. E[cg(X)]=cE[g(X)]E[cg(X)]=cE[g(X)]

  39. E[g(X)±h(X)]=E[g(X)]±E[h(X)]E[g(X)\pm h(X)]=E[g(X)]\pm E[h(X)]

  40. E[c]=cE[c]=c

  41. 方差的定義Var[X]=E[XE(X)]2Var[X]=E[X-E(X)]^2,標準差Var[X]\sqrt{Var[X]}

  42. Var[c]=0Var[c]=0

  43. Var[aX+b]=a2Var[X]Var[aX+b]=a^2Var[X]

  44. Var[X]=E(X2)E[X]2Var[X]=E(X^2)-E[X]^2

  45. 二項分佈b(n,p)b(n,p)的方差爲np(1p)np(1-p)

  46. 均勻分佈的方差爲(ba)2/12(b-a)^2/12

  47. 伽馬分佈的方差爲α/λ2\alpha/\lambda^2

    • α=1\alpha=1,YExp(λ),E(Y)=λ1,Var[Y]=λ2,σ[X]=λY\sim Exp(\lambda),E(Y)=\lambda^{-1},Var[Y]=\lambda^{-2},\sigma[X]=^{-\lambda}

    • α=n2,λ=12\alpha=\frac{n}{2},\lambda=\frac{1}{2},Zχ2(n)Z\sim \chi^2(n),
      E[Z]=n,Var[Z]=2nE[Z]=n,Var[Z]=2n

  48. 切比雪夫不等式
    P(XE[X]ϵ)Var[X]ϵ2P(|X-E[X]|\geqslant \epsilon)\leqslant \frac{Var[X]}{\epsilon^2}

    • 這個不等式對於連續或者離散的都成立.

    • 這個等式是描述概率曲線兩端的和小於某個值.

    在這裏插入圖片描述

  49. 方差爲0的隨機斌量X必幾乎處處爲常數.這個常數就是其期望E(X)E(X),這個定理亦可表示爲:若Var[X]=0,Var[X]=0,P(X=E[X])=1P(X=E[X])=1

  50. 貝努力大數定律:
    XnX_n是n重貝努力試驗中事件A發生的次數.又設事件A發生的概率P(A)=pP(A)=p,則對任意的ϵ>0\epsilon>0,有
    limn0P(Xnnpϵ)=0\lim_{n\rightarrow 0}P(|\frac{X_n}{n}-p|\geqslant \epsilon)=0
    這個就是弱大數定理.偏差幾乎處處爲0,但是不代表就不存在偏差.

  51. 矩,c爲常數,k爲正整數.則E(Xc)kE(X-c)^k稱爲X分佈關於c的k階矩.

    • c=0c=0,則E[X]kE[X]^k稱爲X分佈的k階原點矩.記作μk\mu_k;

    • c=E[X]c=E[X],則E[XE[X]]kE[X-E[X]]^k,稱爲X分佈的k階中心矩.記爲υk\upsilon_k

    • 一階原點矩就是期望,二階中心距就是方差.

    • 中心距和原點矩之間的關係
      υk=i=1kCkiμi(μ1)ki\upsilon_k=\sum_{i=1}^{k}C_k^i\mu_i(-\mu_1)^{k-i}

  52. 變異係數
    Cυ=υ2μ1=Var[X]E[X]C_{\upsilon}=\frac{\sqrt{\upsilon_2}}{\mu_1}=\frac{\sqrt{Var[X]}}{E[X]}

    變異係數,可以用來衡量從北京到上海的某些測量結果E[X]=1464(kilometer),σ(X)=500(meter),Cυ=0.00034E[X]=1464(kilometer), \sigma(X)=500(meter), C_{\upsilon}=0.00034,還有你測量100m的參數,E[Y]=100m,σ[Y]=0.05m,Cυ0.0005E[Y]=100m, \sigma[Y]=0.05m, C_{\upsilon}-0.0005,由此可見還是前者更爲精確.

  53. 偏度
    β1=υ3(υ2)3/2=E[XE[X]]3[E[XEX]2]3/2\beta_1=\frac{\upsilon_3}{(\upsilon_2)^{3/2}}=\frac{E[X-E[X]]^3}{[E[X-EX]^2]^{3/2}}

    在這裏插入圖片描述

    正態分佈的三階中心距υ3=0β1=0\upsilon_3=0 \rightarrow \beta_1=0.

  54. 峯度 β2=υ4υ22\beta_2=\frac{\upsilon_4}{\upsilon_2^2}

    • 實際上β2\beta_2是任一標準化變量與標準化正態分佈的四節遠點矩之差.

    • 峯度刻畫的是圖像和標準正態分佈的圖像比.是否更尖或者更平.

    • β2>0\beta_2>0,更尖.

    • β2<0\beta_2<0,更爲平坦.

  55. 中位數 F(x0.5)=x0.5p(x)dx=0.5F(x_{0.5})=\int_{-\infty}^{x_{0.5}}{p(x)dx}=0.5
    也就是圖像在x0.5x_{0.5}右邊的概率和等於右邊的概率和.

    • 中位數一定存在,但是期望卻不一定.

    • 分佈對稱時,對稱中心就是中位數.

  56. 分位數
    F(xα)=xαp(x)dx=α,0<α<1F(x_{\alpha})=\int_{-\infty}^{x_{\alpha}}{p(x)dx}=\alpha,0<\alpha<1
    下側分位數
    1F(xα)=xαp(x)dx=α1-F(x^{'}_{\alpha})=\int_{x^{'}_{\alpha}}^{\infty}{p(x)dx}=\alpha

  57. 衆數,離散時,代表發生次數最多的事件.連續時,代表概率曲線的最大值
    衆數用Mod(X)Mod(X)表示.

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章