Winograd卷積應用（NEON 和 SSE 對應指令）

原創

2020-02-24 18:25

用矩陣乘法（im2col+sgemm）的方式卷積，雖然速度很算可以，但非常費內存，不能應用大一點的圖片。

看了一些博客說到Winograd卷積，比上面的速度更快，用到內存更小，也來試試。

下載FeatherCNN
地址：http://github.com/tencent/FeatherCNN

然後，把一些NEON指令改爲SSE指令就可以運行了。

這裏是一部分對應項：

//#include 
arm_neon.h;pmmintrin.h//vs9.0(2008)
arm_neon.h;immintrin.h//vs10(2010)

float32x2_t;__m64
float32x4_t;__m128
float32x4x2_t;__m256
//如沒有 __m256,則
typedef struct float32x4x2_t
{
  __m128 val[2];
} float32x4x2_t;

// 賦初值0
vdupq_n_f32(0.f);_mm_setzero_ps();
//賦初值 非0
vdupq_n_f32;_mm_set1_ps

//load outptr地址起始的4個float數據到_sum1
vld1q_f32;_mm_load_ps 

//融合倍增累加：vfma->r=a+b*c
vfmaq_f32(a, b, c);_mm_add_ps(a,_mm_mul_ps(b, c));

//將_sum中四個float32,賦值給以outptr爲起始地址的4個float32
vst1q_f32;_mm_store_ps

+;_mm_add_ps//m3 = _mm_add_ps(m1, m2);// m3 = m1 + m2

-;_mm_sub_ps

*;_mm_mul_ps//m1 = _mm_mul_ps(*pSrc1, *pSrc1);// m1 = *pSrc1 * *pSrc1

/;_mm_div_ps

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

超分辨率重建——病態、單應矩陣、高斯權重

我們經常會提到，超分辨率重建是一個病態問題，那麼這裏的病態該如何理解呢？病態問題本身的定義是：對於一個數值問題本身，如果輸入數據有微小的擾動（即誤差），引起輸出數據（即問題的解）相對誤差很大，這就是病態問題。設a爲輸入數據的相對誤差，

小白在成长

2020-07-06 13:05:40

超分辨率重建——先驗信息，先驗概率，後驗概率，最大後驗概率

讀超分辨率重建的文章，特別是一開始讀一些基礎的差值的方法的文章時，經常提到的一個概念就沒有運用到圖像的先驗信息。所謂的先驗信息可以理解爲在實驗之前，已經得到的一些信息，即先驗信息。對於圖像，它可能存在着一些梯度方面的特徵，符合某些統計

小白在成长

2020-07-06 12:26:42

仿射變換與透視畸變

在恢復圖像的過程中，可能會需要對透視畸變以及仿射變換進行補償，今天整理了下關於透視畸變和仿射變換的相關概念。首先講仿射變換，仿射變換一種二維座標到二維座標之間的線性變換，保持二維圖形的“平直性”（譯註： straightness，即變換

小白在成长

2020-07-06 12:26:42

關於線性空間和線性映射

在超分辨率重建過程中的圖像塊配對時，經常會提到非線性映射這麼一個詞，所以抽時間整理一下關於線性映射和非線性映射的相關概念。爲了搞清楚線性映射，首先得搞清楚線性空間，爲了搞清楚線性空間，首先要知道數域的概念以及由此展開的n多線性空間的概念

小白在成长

2020-07-06 12:26:41

Sign函數

今天在看一篇基於深度學習的超分辨率重建的文章中遇到這樣一個函數sign（x），這是一個符號函數，用於把函數的符號析離出來，在數學和計算機運算中，其功能是取某個數的符號（正或負）：當x>0，sign(x)=1; 當x=0，sign

小白在成长

2020-07-06 12:26:41

超分辨路重建：字典學習

問題描述假設已有N張稀疏的圖像，大小爲800*800。請問如何通過稀疏表達的方式對原有圖像數據進行壓縮，同時保證圖像儘量不失真。y向量代表原有的圖像（640000維），A是字典矩陣（K*640000），x是稀疏表示向量（K維），因爲K遠

2020-07-04 16:29:39

C++ 實現超分 Meta-SR

Meta-SR（任意放大倍數的超分辨率），大概意思是：可以是非整數倍的，並且只要一個模型（就可以實現2，3，4 倍及它們之中間倍數，比如，2.3, 3.5 倍等）在《Meta-SR--master》中提供了一個訓練好的模型（百度盤

2020-06-20 01:53:36

C++實現多維轉換（torch.Transpose、permute）{Meta-SR}

這裏要實現 Meta-SR 中的元放大部分中的多維操作，比如：torch.cat，torch.arange，torch.matmul，torch.Transpose，Tensor.view，Tensor.permute 等。 matmul

2020-06-20 00:54:22

學習筆記之——基於深度學習的圖像超分辨率重建

最近開展圖像超分辨率（ Image Super Resolution）方面的研究，做了一些列的調研，並結合本人的理解總結成本博文~（本博文僅用於本人的學習筆記，不做商業用途）本博文涉及的paper已經打包，供各位看客下載哈

2020-06-16 15:22:25

用超分辨程序去模糊

超分辨按實現方式分兩類： 1。雙三次放大 + 網絡 = 大圖 2。小圖 + 網絡 = 大圖對中間部分 “網絡” 來說：第1種學習到了：怎樣把模糊圖變成清晰圖。SRCNN VDSR DRCN DRRN 是

2020-06-10 00:39:50

超分辨率基礎篇：基於拉普拉斯金字塔的人臉超分

2020-05-21 15:29:12

AdaDSR（Deep Adaptive Inference Networks for Single Image Super-Resolution論文筆記）

进击的小胖纸

2020-05-01 13:01:02

超分辨率重建——梯度下降、座標下降、牛頓迭代

小白在成长

2020-02-24 20:14:37

關於機器學習、深度學習以及模式識別

小白在成长

2020-02-24 20:14:37

超分辨率重建——鄰近算法Nearest Neighbor

小白在成长

2020-02-24 20:14:37

24小時熱門文章

最新文章

最新評論文章