1.目標檢測的基本任務
目標檢測是計算機視覺的一個基本方向。其基本任務就是從一張圖片裏找到一些物體,判斷這些物體是什麼,並且儘可能好的把這個物體用一個矩形框給框起來。
其中確定物體是什麼就是一個分類任務
而對邊界框進行確定就需要迴歸任務
如何知道一個矩形框的具體位置呢,要麼你知道左上角的頂點座標,然後還知道矩形的寬和高。要麼你知道左上角和右下角兩個對角頂點的座標。
基本的任務很清楚,但是實操起來會遇到幾個基本的問題:
- 圖像中的目標個數不確定,比如上圖有好幾個人,那也可能人更多,也可能一個也沒有。我們事先是不知道有幾個目標,每個目標有幾個的。
- 矩形框的位置到底怎麼求才最好。
2.目標檢測發展歷程簡述
在神經網絡火之前,也有傳統的目標檢測算法。比如滑動窗口,但是這種算法處理起來慢,而且性能並不是十分的好。
後來,神經網絡被用於目標檢測,逐漸有了R-CNN,Fast R-CNN,Faster R-CNN, Mask R-CNN,Yolo,SSD等等算法。
這些算法大致分爲兩類:
- two-stage :先生成候選框,然後再對候選框進行分類和迴歸,如:各種R-CNN。優點是準確度高,缺點是慢。
- one-stage:直接預測目標的種類和位置。如Yolo,SSD。優點是快,缺點是準確度不夠高。