20應用統計考研複試要點(part16)--應用多元分析

學習筆記,僅供參考,有錯必糾


王學明應用多元分析


判別分析


貝葉斯判別

  • 貝葉斯統計思想

假定對研究對象已有一定認識,常用先驗概率分佈來描述這種認識,然後抽取樣本來修正已有認識,得到後驗概率分佈,各種統計推斷都通過後驗概率分佈來進行。

  • 最大後驗概率法

設有k個組πi,π2,...,πk\pi_i,\pi_2,...,\pi_k,且組πi\pi_i的概率密度爲fi(x)f_i(x),樣品x來自組πi\pi_i的先驗概率爲pi,i=1,2,...,kp_i,i=1,2,...,k,滿足p1+p2+...+pk=1p_1+p_2+...+p_k=1

利用貝葉斯理論,x屬於πi\pi_i的後驗概率(即當樣品 x已知時,它屬於πi\pi_i的概率)如式(1)所示:

在這裏插入圖片描述

先驗概率:驗前概率,一種權重。所謂“先驗”是指先於我們抽取樣本做判別分析的時候。可根據經驗或歷史資料或訓練樣本中的各類樣品的比例得到,還可假定都相等。

最大後驗概率法是採用如下的判別規則式(2)

在這裏插入圖片描述

後驗概率給出了對樣品x歸屬哪一組作出正確判斷的確信程度。

例如,考慮兩組的情形,欲判別x屬於組π1\pi_1還是組π2\pi_2,若P(π1x)=0.54,P(π2x)=0.46P(\pi_1|x)=0.54,P(\pi_2|x)=0.46,則雖判斷x屬於組π1\pi_1但正確判斷的確信程度較低,不太有把握;若P(π1x)=0.97,P(π2x)=0.03P(\pi_1|x)=0.97,P(\pi_2|x)=0.03,則雖同樣判斷x屬於組π1\pi_1,,但此時對判斷的正確性是非常確信、有把握的。

最重要的特例是k個組都是正態的,即πiNp(μi,Σi),Σi>0,i=1,2,...,k\pi_i \sim N_p(\mu_i, \Sigma_i),\Sigma_i >0, i=1,2,...,k,這時,組πi\pi_i的概率密度如式(3)所示:

在這裏插入圖片描述

是x到πi\pi_i的平方馬氏距離.

將式(3)帶入式(1)可得後驗概率的計算公式:

在這裏插入圖片描述

D2(x,πi)D^2(x,\pi_i)爲x到πi\pi_i的廣義平方距離。

在正態性假定下,判別規則式(2)也可等價地表達爲:

在這裏插入圖片描述

  • 最小期望誤判代價法

在進行判別分析的過程中難免會發生誤判,各種誤判所產生的後果可能有聽不同。例如,將一批不合格的藥誤判爲合格的比將合格的誤判爲不合格的一般有着更嚴重的後果。誤判代價就是這種誤判後果的數量表現。最大後驗概率法沒有涉及誤判的代價,在各種誤判代價明顯不同的場合下,該判別法就不適宜了。

設有k個組πi,π2,...,πk\pi_i,\pi_2,...,\pi_k,分別有密度函數f1(x),f2(x),...,fk(x)f_1(x), f_2(x),...,f_k(x);出現這k個組的先驗概率爲p1,p2,...,pkp_1,p_2,...,p_kc(li)c(l|i)爲來自πi\pi_i卻判別爲πl\pi_l的代價,對於l=i,  c(ii)=0l=i, \; c(i|i)=0RlR_l爲所有判別爲πl\pi_l的x的集合

在這裏插入圖片描述

在這裏插入圖片描述

在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章