【1】目標檢測簡述

1.目標檢測的基本任務

目標檢測是計算機視覺的一個基本方向。其基本任務就是從一張圖片裏找到一些物體,判斷這些物體是什麼,並且儘可能好的把這個物體用一個矩形框給框起來。
其中確定物體是什麼就是一個分類任務
而對邊界框進行確定就需要迴歸任務

在這裏插入圖片描述
在這裏插入圖片描述
如何知道一個矩形框的具體位置呢,要麼你知道左上角的頂點座標,然後還知道矩形的寬和高。要麼你知道左上角和右下角兩個對角頂點的座標

基本的任務很清楚,但是實操起來會遇到幾個基本的問題:

  • 圖像中的目標個數不確定,比如上圖有好幾個人,那也可能人更多,也可能一個也沒有。我們事先是不知道有幾個目標,每個目標有幾個的。
  • 矩形框的位置到底怎麼求才最好。

2.目標檢測發展歷程簡述

在神經網絡火之前,也有傳統的目標檢測算法。比如滑動窗口,但是這種算法處理起來慢,而且性能並不是十分的好。

後來,神經網絡被用於目標檢測,逐漸有了R-CNN,Fast R-CNN,Faster R-CNN, Mask R-CNN,Yolo,SSD等等算法。

這些算法大致分爲兩類:

  • two-stage :先生成候選框,然後再對候選框進行分類和迴歸,如:各種R-CNN。優點是準確度高,缺點是慢。
  • one-stage:直接預測目標的種類和位置。如Yolo,SSD。優點是快,缺點是準確度不夠高。

3.目標檢測常用算法對比

在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章