原创 SPPNet略讀

論文:Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition 作者:何愷明 時間:2014 論文:https://arxiv.or

原创 Fast R-CNN論文略讀

SPP引入之後,解決了輸入圖片尺寸不一致和多次feed proposal帶來的問題,但是訓練過程仍然比較繁瑣,需要提取proposal,訓練cnn,還要訓練SVM,分別輸出box座標和類別,且過程中要佔用大量磁盤資源,爲了解決這個

原创 R-CNN略讀

題目:Rich feature hierarchies for accurate object detection and semantic segmentation 第一作者:Ross Girshick 大佬 UC Berkel

原创 FCOS源碼閱讀1

FCOS代碼真的好多啊,一點一點分析好了,先來看看tools目錄下的train_net.py def train(cfg, local_rank, distributed): #local rank是啥,distributed就

原创 FCOS論文簡析

題目:FCOS:Fully Convolutional One-Stage Object Detection 第一作者:Zhi Tian The University of Adelaide, Australia 發表:CVPR2

原创 GoogLeNet(Inception-v1)

inception是2014年Christian Szegedy提出的一種全新的深度學習結構,在這之前的AlexNet、VGG等結構都是通過增大網絡的深度(層數)來獲得更好的訓練效果,但層數的增加會帶來很多負作用,比如overfit、梯度

原创 Inception-v3

paper:Rethinking the Inception Architecture for Computer Vision Abstract 本文通過適當增加計算條件下,通過suitably factorized convolutio

原创 AlexNet

AlexNet是2012年ImageNet競賽冠軍獲得者Hinton和他的學生Alex Krizhevsky設計的。也是在那年之後,更多的更深的神經網路被提出,比如優秀的vgg,GoogleLeNet。其官方提供的數據模型,準確率達到57

原创 matplotlib中的ion()和ioff()函數

在學習莫煩python的一些代碼時發現經常出現plt.ion()和plt.ioff函數,經查詢總結如下: python數據可視化庫matplotlib有兩種運行模式阻塞(block)模式和交互(interactive)模式,在python

原创 torch.squeeze()和unsqueeze()

queeze() 函數功能:去除size爲1的維度,包括行和列。當維度大於等於2時,squeeze()無作用。 其中squeeze(0)代表若第一維度值爲1則去除第一維度,squeeze(1)代表若第二維度值爲1則去除第二維度。 eg1:

原创 Inception-v2

前言 Batch Normalization是由google提出的一種訓練優化方法。參考論文:Batch Normalization Accelerating Deep Network Training by Reducing Inter

原创 VGG

一. 簡述 VGG卷積神經網絡是牛津大學在2014年提出來的模型。當這個模型被提出時,由於它的簡潔性和實用性,馬上成爲了當時最流行的卷積神經網絡模型。它在圖像分類和目標檢測任務中都表現出非常好的結果。在2014年的ILSVRC比賽中,

原创 LeNet-5

LeNet-5結構及參數計算 轉:http://blog.csdn.net/geekmanong/article/details/50605340 輸入:32∗3232∗32的手寫字體圖片,這些手寫字體包含0 90 9數字,也就是相