第一類錯誤和第二類錯誤
假設檢驗(hypothesis testing)是數理統計中根據一定的假設條件,由樣本來推測總體的一種方法。假設檢驗實際上是一種反證法的思想,常見的做法是先構建統計量,然後在假設下,統計量往往有一個分佈,當我們計算出統計量處於分佈的小概率區域中時,我們就可以說假設是小概率事件,可以拒絕零假設。常見的假設檢驗的方法有u-檢驗法、t檢驗法、卡方檢驗、F-檢驗、秩和檢驗等。
維基百科中對 Type Ⅰ和 Type Ⅱ error的解釋是:
type I error is the rejection of a true null hypothesis (also known as ‘False Positive’)
type II error is failing to reject a false null hypothesis (also known as ‘False Negative’)
從字面上來進行理解,第一類錯誤就是原假設是正確的,但是拒絕了它;第二類錯誤就是原假設是錯誤的,但是接受了它。
再加上知乎上對於第一類和第二類錯誤的幾種形象解釋來加深一下印象:
例子一:
出自作者:馬志陽
鏈接:https://www.zhihu.com/question/20993864/answer/81244176
按照平時的習慣,對於原假設我們一般都是拒絕的,所以對原答案進行了一點修改:
假設檢驗就好比談戀愛,你需要推測這個男生是否是真心愛你的,所以需要作出下面的假設:
:他不是一個真心愛你的男生
:他是一個真心愛你的男生
如果實際上成立,而你憑藉經驗拒絕了這假設,也就是你和這個不愛你的男生在一起了,這樣就是犯了第Ⅰ類錯誤。
如果實際上不成立,而你接受了這個假設,也就是你失去了和一個真正愛你的男生在一起的機會,這樣就是犯了第Ⅱ類錯誤。
如果要同時減少犯第一類錯誤和第二類錯誤的概率,那就只能通過增加戀愛的次數,比如一個經歷過次戀愛的女生,第101次戀愛犯第一類錯誤和第二類錯誤的概率就會小很多了。
例子二
出自作者:DDTemp
鏈接:https://www.zhihu.com/question/20993864/answer/93762491
先提出假設:
: He/She are not pregnant
: He/She are pregnant
對應圖中的描述,左圖中,錯誤的拒絕了假設,所以說犯了第一類錯誤;右圖中,錯誤的接受了假設。
補充
1、第一類錯誤的概率就是錯誤地拒絕了原假設的概率,也就是p-value。
2、第一類錯誤和第二類錯誤是負相關的,即第一類錯誤概率大,第二類錯誤概率就小,但是兩者的概率之和不是1,否則的話犯錯的概率就是1了。
REF
https://blog.csdn.net/weixin_34226182/article/details/86400139
https://www.zhihu.com/question/20993864/answer/93762491
https://www.zhihu.com/question/20993864/answer/81244176