醫學圖像評價指標

前言

在論文閱讀的過程中,經常遇到使用特異性(specificity)和靈敏度(sensitivity)這兩個指標來描述分類器的性能。對這兩個指標表示的含有一些模糊,這裏查閱了相關資料後記錄一下。

分類問題

考慮一個二分類的情況,類別爲1和0,我們將1和0分別作爲正類(positive)和負類(negative),則實際分類的結果有4種,表格如下:

image.png
從這個表格中可以引出一些其它的評價指標:
- ACC:classification accuracy,描述分類器的分類準確率
計算公式爲:ACC=(TP+TN)/(TP+FP+FN+TN)
- BER:balanced error rate
計算公式爲:BER=1/2*(FPR+FN/(FN+TP))
- TPR:true positive rate,描述識別出的所有正例佔所有正例的比例,敏感度(sensitivity)、查全率(Recall)
計算公式爲:TPR=TP/ (TP+ FN)
- FPR:false positive rate,描述將負例識別爲正例的情況佔所有負例的比例
計算公式爲:FPR= FP / (FP + TN)
- TNR:true negative rate,描述識別出的負例佔所有負例的比例,特異度(specificity)
計算公式爲:TNR= TN / (FP + TN)
- PPVPositive predictive value陽性預測值、查準率(Precision)
計算公式爲:PPV=TP / (TP + FP)
- NPVNegative predictive value陰性預測值
計算公式:NPV=TN / (FN + TN)

維基百科的附圖

 

下面以醫學中糖尿病人的篩查爲例對敏感度和特異度進行解釋。在這個例子中,我們只將病人血糖水平作爲判斷是否患有糖尿病的指標。下圖爲正常人和糖尿病患者血糖水平的統計圖:

我們發現兩個人羣中有重疊的部分,這個時候判定標準定的不同,得到的結果就會不同。
如果我們把標準定在最左邊的虛線上,則低於這條線的爲正常人,高於這條線的包含了兩類人:正常人和糖尿病患者。這種時候就是靈敏度最高的時候,即實際有病而被診斷出患病的概率,沒有放過一個患病的人。如果將標準定在最右邊的虛線上,則是特異度最高的時候,即實際沒病而被診斷爲正常的概率,沒有冤枉一個沒病的人。
終上所述,敏感度高=漏診率低,特異度高=誤診率低。
理想情況下我們希望敏感度和特異度都很高,然而實際上我們一般在敏感度和特異度中尋找一個平衡點,這個過程可以用ROC(Receiver Operating Characteristic)曲線來表示:

即圖中V34點,具有較高的靈敏度和特異度。

分割問題

符號定義:

         :  代表 ground truth的分割結果

         :代表預測的分割結果

(1)DICE(值域爲[0,1]): 使用頻率最高。數學定義如下,具體表示兩個物體相交的面積佔總面積的比值,完美分割該值爲1。 

(2)VOE(volumetric overlap error): 與DICE類似,數學定義如下,它將and操作換成了減法操作,以此來代表錯誤率。

                                                                       

(3)RVD(relative volume difference):表示兩者體積之間的差異,數學定義如下。

(4)ASD(average symmetric surface distance: 先定義 代表的是預測的中的邊界的像素,同樣地可以得到的定義。然後對的定義,同理可得的定義。那麼ASD的數學定義爲: 

(5)MSD(maximum symmetric surface distance):與ASD定義比較類似,只不過把計算平均的操作替換成了計算最大值的操作。其數學定義爲:

 

參考資料

https://blog.csdn.net/A_a_ron/article/details/79051077?utm_source=copy

https://blog.csdn.net/zichen_ziqi/article/details/80408465

https://github.com/Visceral-Project/EvaluateSegmentation

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章