在信息檢索,文類問題中,我們會遇到 準確率(Precision),召回率(Recall),和F值(F-Measure又稱爲F-Score)。 網上對於這些定義已經有很詳細的解釋,我在此再寫一下,用作自己複習之用
如果有雷同,請告知。
召回率(Recall) = 系統檢索到的相關文件 / 系統所有相關的文件總數
準確率(Precision) = 系統檢索到的相關文件 / 系統所有檢索到的文件總數
相關文件即有輸出的文件(不論對錯)
另一種表述形式:
正確率 = 正確識別個體數 / 抽樣總數(識別出個體數)
召回率 = 正確識別個體數 / 樣本中該個體總數(不論是否抽取)
F值 = 正確率 * 召回率 *2 /(正確率+召回率)
這裏 拿一個別人寫好的例子來說明一下:
某池塘有1400條鯉魚,300只蝦,300只鱉。現在以捕鯉魚爲目的。Seaeagle撒一大網,逮着了700條鯉魚,200只蝦,100只鱉。那麼,這些指標分別如下:
正確率 = 700 / (700 + 200 + 100) = 70%
召回率 = 700 / 1400 = 50%
F值 = 70% * 50% * 2 / (70% + 50%) = 58.3%
正確率是評估捕獲的成果中目標成果所佔得比例;
召回率,顧名思義,就是從關注領域中,召回目標類別的比例;
而F值,則是綜合這二者指標的評估指標,用於綜合反映整體的指標。F值較高時,反應驗證方法比較有效。
文章參考:
http://blog.chinaunix.net/uid-23028928-id-2567754.html