-
隨機變量:
假如一個變量在數軸上的取值依賴於隨機現象的基本結果,則稱此變量爲隨機變量.
-
累計概率分佈函數(分佈函數): F(x)=P(X⩽x)
-
可列可加性公理:
P(n=1⋃∞An)=n=1∑∞P(An)
-
二項分佈的期望:X∼b(n,p)
E(X)=x=0∑nxCnxpx(1−p)n−x=np
-
泊松定理:在n重伯努利試驗中,以pn表示在一次實驗中成功發生的概率.且隨着n增大,pn在減小.若n→∞時,λn=npn→λ,λ>0.則出現x次成功的概率爲
Cnxpnx(1−pn)n−x→x!λxe−λ
證明:
(nx)pnx(1−pn)n−x=x!n(n−1)⋯(n−x+1)(nλn)x(1−nλn)n−x=x!λnx(1−n1)(1−n2)⋯(1−nx−1)(1−nλn)n−x
注意,又因爲下面的極限成立
limn→∞λn=λlimn→∞(1−nλn)n−x=e−λ
所以原式成立.值得注意的是,這個分佈和二項分佈不同之處在於,pn是會變化的.它會取極限.
-
泊松分佈:根據泊松定理可得 X∼P(λ)
x=1∑∞x!λxe−λ=eλx=1∑∞x!λx=e−λeλ=1
可見泊松定理推出的一個分佈公式,實際上是一個概率分佈.這個概率分佈是一個典型的離散型分佈.隨機變量取值爲所有非負整數.
-
泊松分佈的期望:
E(X)=x=0∑∞x⋅x!λxe−λ=λe−λx=1∑∞(x−1)!λx−1=λ
-
泊松分佈,總與計數過程相關聯,並且計數是在一定時間內或一定區域內,或特定單位內的前提下進行的.比如
-
在一定時間內,電話總站接錯電話的次數;
-
在一定時間內, 在超市排隊等候付款的顧客人數;
-
在一定時間內,來到車站等候公共汽車的人數;
-
在一定時間內, 某操作系統發生故障的次數;
-
在一個穩定的團體內,活到100歲的人數;
-
一匹布上,瑕疵點的個數;
-
100頁書上,錯別字的個數;
-
一個麪包上,葡萄乾的個數;
-
超幾何分佈:N個產品,其中M個次品.如果進行不放回抽樣.那麼如果抽n次,拿到次品數量的概率分佈.h(n,N,M)
P(X=x)=(Nn)(Mx)(N−Mn−x)x=0,1,⋯,r
其中r=min(n,M),其中我們可以看到的是
x=0∑r(Mx)(N−Mn−x)=(Nn)
由此可見 x=0∑rP(X=x)=1
-
連續隨機變量的概率密度函數 p(x)⩾0
∫−∞+∞p(x)dx=1
P(a⩽X⩽b)=∫abp(x)dx
-
均勻分佈 X∼U(a,b)
-
指數分佈 X∼Exp(λ)
p(x)={λe−λx,x⩾00,x<0 不少產品首次發生故障的時間T服從指數分佈.
-
隨機變量的分佈函數
F(x)=P(X⩽x)=∫−∞xp(x)dx
-
均勻分佈 F(x)=⎩⎪⎪⎪⎨⎪⎪⎪⎧0b−ax−a1,x<a,a⩽x⩽b,x>b
-
指數分佈 F(x)={01−e−λx,x<0,x⩾0
-
連續隨機變量分佈函數的一些性質
-
F(x)是連續函數
-
P(X=x)=0,零概率事件和不可能事件Φ,是有差別的.0️零概率事件不全是不可能事件.同理必然事件的概率爲1.但是概率爲1的事件不全是必然事件.概率爲1的事件實際上是幾乎必然發生的事件.
-
P(a⩽X⩽b)=P(a⩽X<b)=P(a<X⩽b)=P(a<X<b)
-
F′(x)=p(x)
-
P(x;p1(x)=p2(x))=1, 兩個函數在概率論中成爲幾乎處處相等.比如
p1(x)={b−a1,0a<x⩽b, other
p2(x)={b−a1,0a<x<bother,
-
已知隨即變量X的分佈函數FX(x)和密度函數爲pX(x),又設Y=g(x),其中g是嚴格單調的函數.且導數g′(⋅)存在.則Y的概率密度函數爲
pY(y)=pX(h(y))∣h′(y)∣ h(y) 是
y=g(x)的反函數,h′(y)是其導數.
證明:
FY(y)pY(y)=P(Y⩽y)=P(g(X)⩽y)=P(X⩽h(y))=FX(h(y))=pX(h(y))⋅h′(y)
-
均勻分佈的數學期望 E(x)=2a+b
-
指數分佈的期望 E(X)=λ1
-
期望不存在的分佈舉例.柯西分佈
p(x)=π(1+x2)1,−∞<x<∞ 因爲積分,
π1∫−∞∞1+x2∣x∣dx 無限.
-
正態分佈
p(x)=2πσ1Exp(−2σ2(x−μ)2),−∞<x<∞
-
正態分佈的例子描述
-
正態分佈的應用:
-
正態分佈的期望 E(x)=μ
-
標準正態分佈
φ(u)=2π1Exp(−2u2),−∞<u<∞.
Φ(u)=2π1∫−∞uExp(−2x2)dx
Φ(−u)=1−Φ(u)
-
正態分佈的線性變換
X∼N(μ,σ2)→U=σX−μ
-
正態分佈的計算
F(a<X<b)=Φ(σb−μ)−Φ(σa−μ)
P(X<b)=Φ(σb−μ)
P(X>a)=1−Φ(σa−μ)
-
伽馬函數如下所示
Γ(α)=∫0∞xα−1e−xdx,α>0
-
Γ(1)=1,Γ(21)=π
-
Γ(α+1)=αΓ(α),對於自然數有Γ(n+1)=n!
-
∫0∞xα−1e−λxdx=Γ(α)/λα
-
伽馬分佈的概率密度函數,X∼Ga(α,λ) p(x)=⎩⎪⎨⎪⎧Γ(α)λαxα−1eλx0,x>0,x⩽0 其中α>0稱爲形狀參數,λ>0稱爲尺度函數.
-
伽馬分佈的數學期望爲 E(x)=λα
-
α=1的伽馬分佈就是指數分佈.
-
指數分佈X∼Exp(λ)無記憶性 P(X>s+t∣X>s)=P(X>t)
-
λ=21,
α=2n的伽馬分佈稱爲自由度爲n的χ2分佈.X∼χ2
E(x)=n=λα
p(x)=Γ(2n)2n/21x2n−1e−2x,x>0
-
貝塔函數
β(a,b)=∫01fdxxn−1(1−x)b−1dx,a>0,b>0
-
β(a,b)=β(b,a)
-
β(a,b)=Γ(a+b)Γ(a)Γ(b)
-
貝塔分佈的,概率密度函數,X∼Be(a,b)
p(x)=Γ(a)Γ(b)Γ(a+b)xa−1(1−x)b−1,0⩽x⩽1
其中a,b都是形狀參數,且都爲正.
-
不合格率,服從它
-
機器維修率
-
打靶命中率
-
市場佔有率
也就是說各種比率,的話.它們一般服從beta分佈.
-
beta分佈的數學期望 E(x)=a+ba
-
a=b=1的beta分佈實際上就是[0,1]上的均勻分佈.
-
設隨機變量X以及其函數g(X)的數學期望都存在.那麼 E[g(X)]=⎩⎪⎪⎪⎨⎪⎪⎪⎧i∑g(xi)p(xi)∫−∞∞g(x)p(x)dx
-
E[cg(X)]=cE[g(X)]
-
E[g(X)±h(X)]=E[g(X)]±E[h(X)]
-
E[c]=c
-
方差的定義Var[X]=E[X−E(X)]2,標準差Var[X]
-
Var[c]=0
-
Var[aX+b]=a2Var[X]
-
Var[X]=E(X2)−E[X]2
-
二項分佈b(n,p)的方差爲np(1−p)
-
均勻分佈的方差爲(b−a)2/12
-
伽馬分佈的方差爲α/λ2
-
α=1,Y∼Exp(λ),E(Y)=λ−1,Var[Y]=λ−2,σ[X]=−λ
-
α=2n,λ=21,Z∼χ2(n),
E[Z]=n,Var[Z]=2n
-
切比雪夫不等式
P(∣X−E[X]∣⩾ϵ)⩽ϵ2Var[X]
-
這個不等式對於連續或者離散的都成立.
-
這個等式是描述概率曲線兩端的和小於某個值.
-
方差爲0的隨機斌量X必幾乎處處爲常數.這個常數就是其期望E(X),這個定理亦可表示爲:若Var[X]=0,則P(X=E[X])=1
-
貝努力大數定律:
設Xn是n重貝努力試驗中事件A發生的次數.又設事件A發生的概率P(A)=p,則對任意的ϵ>0,有
n→0limP(∣nXn−p∣⩾ϵ)=0
這個就是弱大數定理.偏差幾乎處處爲0,但是不代表就不存在偏差.
-
矩,c爲常數,k爲正整數.則E(X−c)k稱爲X分佈關於c的k階矩.
-
c=0,則E[X]k稱爲X分佈的k階原點矩.記作μk;
-
c=E[X],則E[X−E[X]]k,稱爲X分佈的k階中心矩.記爲υk
-
一階原點矩就是期望,二階中心距就是方差.
-
中心距和原點矩之間的關係
υk=i=1∑kCkiμi(−μ1)k−i
-
變異係數
Cυ=μ1υ2=E[X]Var[X]
變異係數,可以用來衡量從北京到上海的某些測量結果E[X]=1464(kilometer),σ(X)=500(meter),Cυ=0.00034,還有你測量100m的參數,E[Y]=100m,σ[Y]=0.05m,Cυ−0.0005,由此可見還是前者更爲精確.
-
偏度
β1=(υ2)3/2υ3=[E[X−EX]2]3/2E[X−E[X]]3
正態分佈的三階中心距υ3=0→β1=0.
-
峯度 β2=υ22υ4
-
中位數 F(x0.5)=∫−∞x0.5p(x)dx=0.5
也就是圖像在x0.5右邊的概率和等於右邊的概率和.
-
中位數一定存在,但是期望卻不一定.
-
分佈對稱時,對稱中心就是中位數.
-
分位數
F(xα)=∫−∞xαp(x)dx=α,0<α<1
下側分位數
1−F(xα′)=∫xα′∞p(x)dx=α
-
衆數,離散時,代表發生次數最多的事件.連續時,代表概率曲線的最大值
衆數用Mod(X)表示.