原创 論文閱讀005-目標識別綜述-Object Detection in 20 Years: A Survey

這篇綜述的v2版本比較新,是2019年5月發的,總結了近20年來目標識別的主要方法、技術演進和未來發展。讀完可以算是對這個方向有了一個大概的瞭解。 文章地址: https://arxiv.org/abs/1905.05055 什麼

原创 論文閱讀003-VGGNet-Very Deep Convolutional Networks for Large-Scale Image Recognition

自從2012的AlexNet橫空出世後,卷積神經網絡算是在CV領域越來越火熱了。對AlexNet的改進有很多,作者着眼於改進網絡的深度,並且網絡全部層都使用3*3卷積過濾器。 作者公佈了兩個表現最好的模型 http://www.r

原创 論文閱讀002-Inception V3-Rethinking the Inception Architecture for ComputerVision

Inception v3 使用場景 內存和計算量有限的情況,比如移動設備 設計原則(作者強調了以下原則並不是一定正確,要結合實際運用場景來評估) 1、Avoid representational bottlenecks, espe

原创 論文閱讀001-AlexNet-ImageNet Classification with Deep Convolutional Neural Networks

摘要翻譯 在ImageNet LSVRC-2010競賽中,我們訓練了一個龐大的深度卷積神經網絡,將120萬張高像素圖片分成1000類。在測試集中,top-1和top-5的錯誤率達到了37.5%和17.0%,這是目前最好的結果。神經

原创 mac+Xcode+opencv+ c++環境配置

主要流程1-下載opencv全平臺可編譯文件2-安裝homebrew3-安裝cmake4-安裝opencv5-Xcode建立項目6-配置項目7-實例測試 1-下載opencv全平臺可編譯文件 官網下載:https://github

原创 使用pytorch進行遷移學習 修改預訓練權重模型的分類層/輸出類別(附mmaction相關實現代碼)

文章目錄examplestep1 文件建立step2 獲得預訓練模型step3 模型修改參考文章 example 以mmaction中的tsn+resnet50+kinetics訓練的模型作爲預訓練模型,拿來訓練TSN+resne

原创 mmaction中的rawframes_dataset.py

文章目錄 相關的包 import mmcv import numpy as np import os.path as osp from mmcv.parallel import DataContainer as DC from t

原创 mmaction中的transforms.py

文章目錄 import mmcv import numpy as np import random import math __all__ = ['GroupImageTransform', 'ImageTransform',

原创 TPN中的resnet源碼閱讀筆記

文章目錄resnet 該TPN項目是基於mmaction修改的。所以這裏的resnet是由mmaction實現的,不過還是與mmaction的resnet有所不同。 resnet resnet的講解resnet50圖解 torch

原创 論文閱讀006-RCNN-Rich feature hierarchies for accurate object detection and semantic segmentation

目錄寫在前面本文重點模型設計步驟一:有監督預訓練網絡參數步驟二:模型fine-tuning步驟三:特徵提取步驟四:訓練SVM分類器步驟五:迴歸器精選候選框位置模型缺點官方源碼 寫在前面 閱讀論文的時候有一些術語不理解,在這裏彙總一

原创 論文閱讀009-Fast R-CNN

文章目錄寫在前面本文重點模型設計步驟一:圖片特徵提取步驟二:生成region proposal步驟三:region proposal轉成固定尺寸(ROI Pooling)【本文創新點】✔️步驟四:全連接層奇異值分解【本文創新點】✔

原创 論文閱讀008-SPPNet-Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

文章目錄寫在前面本文重點模型設計步驟一:候選框搜索步驟二:全圖特徵提取(1-5層)步驟三:候選框特徵提取(SPM)步驟四:特徵向量分類識別討論參考文獻 寫在前面 SPP-Net是2015年發表在IEEE上的論文,基於R-CNN改進

原创 論文閱讀004-ResNet-Deep Residual Learning for Image Recognition

首先通過卷積神經網絡by吳恩達所簡要介紹的ResNet來說明該論文的重點。可以發現有兩個重點: 1、提出了Residual block的結構 2、大大地提高了模型的可訓練層數 Residual block結構 從吳恩達課程的

原创 卷積神經網絡中的卷積有什麼用?

卷積可以提取圖片中的特徵。 參考文獻 https://blog.csdn.net/charleswangzi/article/details/82733016 結合卷積神經網絡by吳恩達 來看, 上圖所示的卷積核在不同的論文中被

原创 論文閱讀003-Very Deep ConvolutionalNetworks for Text Classification

摘要(中文渣翻) 對於許多NLP任務,主要方法是循環神經網絡,特別是LSTMs,以及卷積神經網絡。可是,這些結構相對於深度卷積神經網絡是相當淺的,深度卷積神經網絡在計算機視覺領域是最前沿的。我們展示了一種新的結構**(VD-CNN