統計學習第五彈--python實踐概率分佈

正態分佈(Normal distribution)

正態分佈(Normal distribution),又名高斯分佈(Gaussian distribution),正態曲線呈鍾型,兩頭低,中間高,左右對稱,中央部位的概率密度最大。越偏離均值,其概率密度減小。
若隨機變量X服從一個數學期望爲μ、方差爲σ2的正態分佈,記爲N(μ,σ2)。其概率密度函數爲正態分佈的期望值μ決定了其位置,其標準差σ決定了分佈的幅度。當μ = 0,σ = 1時的正態分佈是標準正態分佈。
概率密度函數f(x):通過它可以求出一個數據範圍內的某個連續變量的概率,可以指出該概率分佈的形狀。
概率密度:通過面積指出各種範圍內的概率大小,通過概率密度函數進行描述。
求解正態分佈概率步驟:
(1)確定分佈和範圍,即算出均值和標準差;
(2)將分佈標準化,求出標準分;

 

 Python 實踐正態分佈的代碼:

def Norm(mu,sigma):
    """
    mu:正態分佈的均值
    sigma:標準差
    """
    import numpy as np
    import matplotlib.pyplot as plt
    plt.rcParams['font.sans-serif'] = ['SimHei'] #正常顯示中文
    plt.rcParams['axes.unicode_minus'] = False #正常顯示負號
    #正態分佈的概率密度函數。可以理解成 x 是 mu(均值)和 sigma(標準差)的函數
    def Norm_PDF(x,mu,sigma):
        pdf = np.exp(-((x - mu)**2)/(2*sigma**2)) / (sigma * np.sqrt(2*np.pi))
        return pdf
    X = np.arange(mu - sigma * 5,mu + sigma * 5, 0.1) #模擬的是5sigma 原則 
    y = Norm_PDF(X,mu,sigma)
    plt.plot(X5,y)
    plt.xlabel('隨機變量:x')
    plt.ylabel('概率:y')
    plt.title('正態分佈:mu=%.1f,sigma=%.1f' % (mu5,sigma))
    plt.grid()
    plt.show()

 

泊松分佈

一個服從泊松分佈的隨機變量X,表示在具有比率參數(rate parameter)λ的一段固定時間間隔內,事件發生的次數。參數λ告訴你該事件發生的比率。隨機變量X的平均值和方差都是λ。

E(X) = λ, Var(X) = λ

泊松分佈的例子:已知某路口發生事故的比率是每天2次,那麼在此處一天內發生4次事故的概率是多少?

具體的代碼實現可以參考:https://blog.csdn.net/weixin_42695959/article/details/84036865

 

參考文獻

賈俊平 中國人民大學出版社 統計學第七版

百度百科

如何在Python中實現這五類強大的概率分佈

 

 

 

 

本文是在木東居士的統計學習小組 學習筆記 供大家參考 

居士是騰訊的以爲數據科學家 在工作之餘組織一些學習小組 不是培訓班 讓大家在一起討論學習

數據科學家學習小組之統計學(第二期)
https://mp.weixin.qq.com/s/JUnaXgjDMcLinMxpJLZ36g

機器學習小組(第一期)學習形式+打卡方式+參考資料
https://mp.weixin.qq.com/s/fUAUm74AAqWYI_UIMmB-mA

發佈了42 篇原創文章 · 獲贊 6 · 訪問量 2萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章