0基礎統計學學習之路----隨機變量的分佈

隨機變量:

隨機變量分爲兩種,第一種是離散型隨機變量,我們可以把離散型隨機變量想象爲可數的數據,比如1個氣泡,1個人,5只青蛙,類似這種的屬於離散型隨機變量,非離散型隨機變量也稱爲連續性隨機變量,如:一個人的身高是1.72米,一段路長20KM,經過的時間爲20分鐘,類似這種是連續型隨機變量。

通常離散型隨機變量是用來描述可列有限多個的數據,連續型隨機變量描述的往往是區間,不可數的數據。

隨機變量的分佈函數:

    長成這樣的就是分佈函數,圖中我們要先區分X和x,他們兩個不是一種數據,我們可以把小x看做爲條件,當x<0的時候概率爲0,0≤x<1的概率爲0.1,這個時候把小x代入前面的公式X就≤0.1,1≤x<2時概率爲0.7,在代入前面的公式X就≤0.7........。

我們利用這種公式可以描述出離散型隨機變量和非離散型隨機變量的分佈規律。

分佈函數的性質:

圖中介紹了分佈函數的性質,我們要注意,分佈函數是一個疊加的過程,他是單調不減的,最後累加的結果都等於1,圖中所說的右連續型的意思就是,因爲這個描述的是概率,所以加的過程中在X軸方向只能向右。

概率密度:

圖中介紹了概率密度的定義,我們仔細觀察,公式裏面有一個區間的標誌,我們可以把它理解爲X軸上-∞到x的面積,用這個面積來描述這個概率,而這個密度就是把這個面積分了多少份。但同時我們要注意,概率密度函數的性質。

 

分佈:

數據分佈的頻率通過圖形描述可以分爲很多種分佈規律,比如:正態分佈,泊松分佈,T分佈,F分佈等等,接下來咱們重點介紹一下分佈。

均勻分佈:

我們可以把均勻分佈在圖中想象爲一個矩形,均勻分佈案例:

指數分佈:

在圖中我們發現指數分佈,這根曲線線面的面積,就是分佈的概率,我們可以把指數分佈想象成一個

 

正態分佈:

當μ=0;σ = 1的時候就叫標準正態分佈,他是這種圖形:

圖上的這條曲線就是正態分佈的樣子,中間的豎線,我們可以把它想象成:均值=中位數=衆數。

這個圖片畫了三個不同的正態分佈,實際就是偏移了,這個有什麼區別呢,注意看,他們的平均值μ不同,所以就偏移了。μ也是正態分佈最高的內個點。

正態分佈在統計學中會經常使用,很多數據的概率都會接近正態分佈。。

二項式分佈:

二項分佈我認爲只要理解他的概念就可以了,二項分佈就是事件發生的結果只有兩種,就像拋硬幣,要麼正要麼反,或者像打籃球,要麼贏,要麼輸,不過我們還要思考上試驗次數的問題,好比說打籃球,一天打20場,贏1場的概率是多少,贏兩場的概率是多少,等等等等。。

上面的圖中p是贏得概率,P=0.2的時候,贏4場的概率較高,P=0.9時,贏18場的概率較高,就是這個意思。

泊松分佈:

泊松分佈聽上去感覺很複雜,其實泊松分佈咱們生活的時候是經常會遇見的,例如每天到醫院看病的人數,呼叫中心一天接到多少個電話,類似這種數據都屬於泊松分佈。

泊松分佈公式:

圖上的公式我們首先要理解其含義,爲了方便咱們理解其含義,直接上栗子:

在圖中表述了公式相對應的含義,我們要理解公式中參數相對應的含義,就好計算了,如果再想討論這個公式是怎麼推導出來的小弟弟就做不到了。。其中,P遺憾是概率,N表示函數關係,t是我們喜愛一個想要預測的時間段,或者區間段,n表示在該時間段或區間段發生事件的頻率,λ表示的是原已知的時間段或區間段內發生時間的頻率,內個e是個常數項,就像π一樣,然後代入公式求解。。。

卡方分佈:

在這裏我們直接就可以把卡方分佈想象成一個總體中抽取樣本,構成的分佈,就叫卡方分佈。。


                                                                                                                    這個篇暫時先介紹到這裏,以後會有更新,具體分佈小弟弟會在以後的博客裏面在詳細的介紹各種分佈及案例。。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章