原创 CPU, GPU, FPGA計算能力

背景現在AI火熱,帶動了異構計算的發展,讓GPU, FPGA這類加速芯片從輔助設備逐步進入了主流計算設備的行列,開始挑戰傳統CPU的絕對統治地位,那麼我們爲什麼經常聽說GPU, FPGA相對於CPU計算能力要強的多,原因是爲什麼呢?芯片設

原创 目標檢測--RCNN算法架構及關鍵技術解析

將RCNN專題報告分享一下,並留作筆記。PPT介紹了整體結構及其中四個關鍵技術:參考資料:1.論文筆記:Rich feature hierarchies for accurate object detection and semantic

原创 卷積操作的幾種類型

卷積操作其實可以分成三種操作:(1)valid 操作,滑動步長爲S,圖片大小爲N1xN1,卷積核大小爲N2xN2,卷積後圖像大小:(N1-N2)/S+1 x (N1-N2)/S+1如下圖: (2)full 操作,滑動步長爲1,圖片大小爲N

原创 CNN中的多通道卷積(RGB等)

卷積過程是對一個通道的圖像進行卷積,比如10個卷積核,得到10個feature map, 那麼輸入圖像爲RGB三個通道呢,輸出就爲 30個feature map嗎, 答案肯定不是的, 輸出的個數依然是卷積核的個數10,只是輸出時對RGB三

原创 目標檢測--Fast RCNN詳解-多細節

Girshick, Ross. “Fast r-cnn.” Proceedings of the IEEE International Conference on Computer Vision. 2015. 繼2014年的RCNN之後,

原创 Caffe中如何計算卷積

1.caffe中通過構造兩個矩陣實現:Caffe中的卷積計算是將卷積核矩陣和輸入圖像矩陣變換爲兩個大的矩陣A與B,然後A與B進行矩陣相乘得到結果C(利用GPU進行矩陣相乘的高效性),三個矩陣的說明如下:(1)在矩陣A中        M爲

原创 實例分割--Mask RCNN詳解(ROI Align / Loss Fun)

目標檢測、語義分割與實例分割:實例分割是一種在像素層面識別目標輪廓的任務,相比其他相關任務,實例分割是較難解決的計算機視覺任務之一:分類:這張圖像中有一個氣球。語義分割:這些全是氣球像素。目標檢測:這張圖像中的這些位置上有 7 個氣球。實

原创 GPU的性能

GPU的性能與指標體現GPU計算能力的兩個重要特徵: 1)CUDA核的個數; 2)存儲器大小。 描述GPU性能的兩個重要指標: 1)計算性能峯值; 2)存儲器帶寬。另參見:Nvidia GPU的浮點計算能力(FP64/FP32/FP16)

原创 CNN中的卷積、反捲積與反池化

圖示理解卷積、反捲積(Deconvolution)、上採樣(UNSampling)與上池化(UnPooling)使用三張圖進行說明: 圖(a)表示UnPooling的過程,特點是在Maxpooling的時候保留最大值的位置信息,之後在un

原创 CSDN博客轉載方法

小結:右擊檢查——選中article_content; article_content代碼處右鍵,點擊【Copy】,再點擊【Copy outerHTML】在markdown編輯器中粘貼以上html代碼 轉載CSDN博客

原创 保存和恢復Tensorflow模型--簡明全面教程

轉自:一個快速完整的教程,以保存和恢復Tensorflow模型。在本教程中,我將會解釋:TensorFlow模型是什麼樣的?如何保存TensorFlow模型?如何恢復預測/轉移學習的TensorFlow模型?如何使用導入的預先訓練的模型進

原创 語義分割--全卷積網絡FCN詳解

1.FCN概述CNN做圖像分類甚至做目標檢測的效果已經被證明並廣泛應用,圖像語義分割本質上也可以認爲是稠密的目標識別(需要預測每個像素點的類別)。傳統的基於CNN的語義分割方法是:將像素周圍一個小區域(如25*25)作爲CNN輸入,做訓練

原创 目標檢測--Faster RCNN算法架構及關鍵點解析

Fast-RCNN基本實現端對端(除了proposal階段外),下一步自然就是要把proposal階段也用CNN實現(放到GPU上)。這就出現了Faster-RCNN,一個完全end-to-end的CNN對象檢測模型。本文是繼RCNN,f

原创 圖像上採樣--雙線性插值

圖像上採樣upsampling的主要目的是放大圖像,主要包括:(1)幾乎都是採用內插值法,即在原有圖像像素的基礎上,在像素點值之間採用合適的插值算法插入新的元素;(2)反捲積方法(Deconvolution),又稱轉置卷積法(Transp

原创 FCN實現細節與幾個問題

1 幾個問題內容參考這篇文章 1)第一個卷積層爲什麼需要添加 pad=100 作者提供的網絡模型裏收個卷積層對輸入圖像添加了100個像素的邊界(圖7)                                         圖7.