RCNN SPPNET FastRCNN FasterRCNN 總結

原創

2020-06-04 04:45

RCNN

流程

1. select search 生成region proposals，並且warp到同一尺度227*227。

2.用CNN對所有region proposals 提取特徵。

3.用SVM對特徵進行分類，然後按類別進行NMS

4.用SVM對所有通過NMS的proposals的位置進行微調。

SPP-NET

RCNN中用會對圖像做多次卷積，非常費時，SPP主要改進就是只需要對原圖提取一次特徵，靠SPP層生成相同大小的特徵。

上圖分別爲RCNN的流程與SPP的流程。

在原圖上的ROI映射到feature maps上之後，分別分成16，4，1個小塊，然後全部過max pooling，拿到21維特徵。如果特徵圖channel數是256，那一共就是256*21維特徵。這樣即使ROI的size不固定，也能保證最後獲取的特徵大小是固定的。

與RCNN相同的是，他還是有select search慢，而且分類和迴歸使用SVM，與CNN分開，SVM的LOSS不能訓練CNN和SPP。

Fast RCNN

替換SVM，直接訓練softmax分類器和bbox regressor迴歸器，可以端到端的訓練模型。

Faster RCNN

提出了RPN，代替SS；引入了anchor（數量K*W*H），通過第一個stage的分類（前景與背景）與迴歸輸出region proposals，使用第二個stage進行進一步的分類（多分類）與位置微調。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Pinecone: 大模型時代的智能索引與搜索解決方案

隨着人工智能技術的飛速發展，大模型（Large Models）已成爲衆多領域的重要工具。無論是自然語言處理、圖像識別還是其他複雜任務，大模型都展現出了強大的性能。然而，隨着模型規模的不斷擴大，數據量的激增，如何有效地管理、索引和搜索這些模型

2024-04-19 11:29:43

如何基於香橙派AIpro對視頻/圖像數據進行預處理

本文分享自華爲雲社區《如何基於香橙派AIpro對視頻/圖像數據進行預處理》，作者：昇騰CANN。受網絡結構和訓練方式等因素的影響，絕大多數神經網絡模型對輸入數據都有格式上的限制。在計算機視覺領域，這個限制大多體現在圖像的尺寸、色域、歸一

2024-04-19 10:32:52

技術引領，策略升級：騰訊雲與你共探數字金融新篇章

引言 2024 年 3 月 27 日下午，在北京騰訊總部，一場關於大模型與數據要素時代數字金融發展的深入討論火熱進行中。【TVP 走進騰訊：大模型與數據要素時代的數字金融發展論壇】是在騰訊二十年發展歷程和數字化實踐的基礎上，進一步探索

2024-04-03 23:09:31

揭祕QQ的AI繪畫大模型技術——QQGC深度解析

隨着人工智能技術的飛速發展，AI繪畫已經成爲了一個備受矚目的領域。在這個領域中，QQGC——QQ的AI繪畫大模型技術，憑藉其卓越的性能和實用性，贏得了廣大用戶的喜愛。那麼，QQGC到底是什麼？它是如何實現的呢？本文將對這些問題進行深入解析。

2024-03-08 00:41:36

深入學習NumPy庫在數據分析中的應用場景

在數據科學與機器學習領域，NumPy（Numerical Python）是一個經常被提及的重要工具。它是Python語言中一個非常強大的庫，提供了高性能的多維數組對象以及用於處理這些數組的工具。NumPy不僅僅是一個用於數值計算的庫，它還

2024-03-02 00:30:28

CPU基本概念

1 概述 CPU是Central Processing Unit的簡稱，中泱處理器。它主要用來執行儲存於程序裏的一系列指令。 2 組成計算機有5大基本組成部分：運算器，控制器，存儲器，輸入和輸出。從邏輯上來看，CPU可以劃分爲

2023-08-22 00:02:32

智慧園區樓宇合集 | 圖撲數字孿生管控系統

智慧園區是指將物聯網、大數據、人工智能等技術應用於傳統建築和基礎設施，以實現對園區的全面監控、管理和服務的一種建築形態。通過將園區內設備、設施和系統聯網，實現數據的傳輸、共享和響應，提高園區的管理效率和運營效益，爲居住者和使用者提供更加智能

2023-07-25 01:41:01

使用篇丨鏈路追蹤（Tracing）很簡單：鏈路實時分析、監控與告警

作者：涯海前文回顧：基礎篇｜鏈路追蹤（Tracing）其實很簡單使用篇｜鏈路追蹤（Tracing）其實很簡單：請求軌跡回溯與多維鏈路篩選在前面文章裏面，我們介紹了單鏈路的篩選與軌跡回溯，是從單次請求的視角來分析問題，類似查詢某個快遞

2023-04-11 09:13:39

百度飛槳數據處理 API 數據格式 HWC CHW 和 PIL 圖像處理之間的關係

使用百度飛槳 API 例如：Resize Normalize，處理數據的時候。 Resize：如果輸入的圖像是 PIL 讀取的圖像這個數據格式是 HWC ，Resize 就需要 HWC 格式的數據。 Normalize：有 data_for

2022-04-30 10:53:32

OpenCV 中的圖像處理 005_形態變換

本文主要內容來自於 OpenCV-Python 教程的 OpenCV 中的圖像處理部分，這部分的全部主要內容如下：改變色彩空間學習在不同色彩空間之間改變圖像。另外學習跟蹤視頻中的彩色對象。圖像的幾何變換學習對圖像應用不同

2022-04-30 09:19:21

OpenCV 中的圖像處理 002_圖像的幾何變換

本文主要內容來自於 OpenCV-Python 教程的 OpenCV 中的圖像處理部分，這個部分的主要內容如下：改變色彩空間學習在不同色彩空間之間改變圖像。另外學習跟蹤視頻中的彩色對象。圖像的幾何變換學習對圖像應用不同的

2022-04-30 09:19:16

OpenCV 官方文檔的組織結構

OpenCV (開源計算機視覺庫：http://opencv.org) 是一個開源庫，它包含了幾百個計算機視覺算法。學習 OpenCV 庫最權威的資料無疑就是 OpenCV 的官方文檔了。 OpenCV 官方提供的文檔比較齊全，這些文檔主要

2022-04-30 09:19:06

中南大學張昊：我非常期待基於AI的圖像視頻編碼技術的創新

點擊上方“LiveVideoStack”關注我們策劃：包研、 Alex 編輯：Alex 張昊年終訪談 #002# 編者按：本週是202

2021-12-28 21:09:09

iNeuOS工業互聯網操作系統，礦山動態產量計量系統和鐵路車輛識別系統應用場景案例

目錄 1. 概述... 2 2. 平臺演示... 2 3. 礦山動態產量計量系統... 2 4. 鐵路車輛識別系統... 4 1. 概述　　iNeuOS工業互聯網操作系統增加礦

2021-12-27 21:17:17

AWS SAP-C01 (461-480)

一家公司正在使用 AWS Organizations 來管理多個 AWS 賬戶。出於安全目的，該公司需要創建一個 Amazon Simple Notification Service (Amazon SNS) 主題，以便在所有組織成員賬

2021-12-25 21:45:34

24小時熱門文章

最新文章

最新評論文章