計算機視覺工程師在面試過程中主要考察三個內容:圖像處理、機器學習、深度學習。然而,各類資料紛繁複雜,或是簡單的知識點羅列,或是有着詳細數學推導令人望而生畏的大部頭。爲了督促自己學習,也爲了方便後人,決心將常考必會的知識點以通俗易懂的方式設立專欄進行講解,努力做到長期更新。此專欄不求甚解,只追求應付一般面試。希望該專欄羽翼漸豐之日,可以爲大家免去尋找資料的勞累。每篇介紹一個知識點,沒有先後順序。想了解什麼知識點可以私信或者評論,如果重要而且恰巧我也能學會,會盡快更新。最後,每一個知識點我會參考很多資料。考慮到簡潔性,就不引用了。如有冒犯之處,聯繫我進行刪除或者補加引用。在此先提前致歉了!
如題,這些東西大多數人都會
但是,記憶內容較多
面試一緊張。。。
主要目的是幫助大家記憶
會分享一些個人的記憶技巧
基本概念
P | Positive | 陽性 | 正樣本 |
---|---|---|---|
N | Negative | 陰性 | 負樣本 |
T | True | 真 |
---|---|---|
TP | True Positive | 真陽性 |
TN | True Negative | 真陰性 |
F | False | 假 |
---|---|---|
FP | False Positive | 假陽性 |
FN | False Negative | 假陰性 |
P = TP + FN
N = TN + FP
舉個例子
正樣本(陽性)被錯誤判定爲負樣本(陰性)
對應上述的FN
五個率
準確率(Accuracy)
反應對整體樣本的分類
有多少樣本預測正確
精確率(Precision)
預測的正樣本中對了多少
精確率以P開頭,所以公式裏全是P
召回率(Recall)
正樣本預測對了多少
召回率和精確率組隊記憶,因爲精確率都是P
所以召回率裏有N
漏警率(Missing Alarm)
正樣本預測錯了多少
與召回率組隊記憶,召回和漏警是反義詞
所以分子取反,T變F,P變N
虛警率(False Alarm)
預測的正樣本中錯了多少
F1 Score
上述指標都存在片面性
計算精確率和召回率的調和平均數
得到一個相對全面的指標
記憶關鍵點:調和平均數、PR
因爲後面還有P-R曲線,所以PR是關鍵詞,應該不難記
P-R曲線
F1 Score還不過癮
使用曲線來更加全面衡量
P是Precision,是縱軸
R是Recall,是橫軸
一個增加,另一個減小,反比例
R的下面像不像兩條腿?
有兩條腿才能更接地氣,與大地貼合
所以R是水平的橫軸
ROC曲線
受試者工作特性(Receiver Operating Characteristic)
另一種評價曲線
表格中的R代表Rate
一個增加,另一個增加,正比例
橫軸 | 假陽性率 | FPR | FP/N |
---|---|---|---|
縱軸 | 真陽性率 | TPR | TP/P |
陽性都是P,真的是T,假的是F
假的對應假的 分母是N
真的對應真的 分母是P
假的人被打倒,趴在了地上,所以是橫軸
AUC(Area Under Curve)
對應上述兩種曲線(一般對應ROC)
曲線和橫軸圍成的面積
或者說曲線的積分
以上兩個曲線橫軸和縱軸的最大值都是1
所以AUC<=1
AUC越大,模型越好
這兩個曲線怎麼畫?
改變分類的閾值(分類的標準)
橫軸和縱軸的值會隨之變化
閾值取的越多
點越多
就畫出來曲線了
兩個曲線的使用範圍?
根據計算公式
P-R主要關注正樣本
ROC關注整體
基於此
樣本比例變化大的時候
P-R變化很大
ROC變化較小
所以
如果比較在意樣本比例變化的影響,用P-R
反之,用ROC
完
歡迎討論 歡迎吐槽