關於密度函數、分佈函數與生存函數的一點看法(一)

       統計中經常會涉及到密度函數、分佈函數與生存函數的概念,如何透徹的理解這三個函數呢,以下是我的一點理解與看法:

  • 何爲生存函數?

       電梯用了六年還能否繼續使用?一個人活了六年還能否再活5年?這些問題都是生存函數研究的領域,一般保險公司會更爲關注生存函數。

  •     何爲分佈函數?

        一個企業的破產概率,對應的就是不破產的概率,那麼分佈函數的對立面就是生存函數,生存函數和分佈函數是成對兒存在的。

  •     那麼密度函數呢?

       統計中能叫出名字的分佈大約有400個左右,例如正態、卡方、F、t、泊松、均勻、指數、二項等等,從事精算相關的工作,如財險精算需要分析師對分佈的瞭解要深些多些。壽險精算對分析師對分佈的瞭解要求略低,因爲壽險精算領域已經相對比較成熟,不過蠻有危機的事是未來壽險領域精算師非常有可能被模型所替代。剛提到的400個分佈的分佈函數間、生存函數間的差別非常小,但是他們的密度函數的差別卻非常大,所以統計中提到分佈這個詞要明白衡量的是密度函數,密度函數研究的主要是變量的圖形探索,SAS中一般會用univariate過程步去探索查看密度函數

       下面用實際數據來進一步說明分佈函數、生存函數與密度函數的計算方法,如下爲學生成績,將分數進行等距分箱,同時分別計算出向上的累計人數、累計人數佔比與向下的累計人數、累計人數佔比,可以得到如我下表統計的數據表格樣例。分別針對向上累計比率與向下累計比率作圖,那麼向上累計比率的分佈圖即爲分佈函數向下累計比率的分佈圖即爲生存函數分數的比例分佈即爲密度函數,如下圖所示。一般分佈函數與生存函數差異不大,變化較大的是密度函數,所以統計中提到分佈的時候,一般指的是密度函數。

我的公衆號:Data Analyst

個人網站:https://www.datanalyst.net/

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章