原创 opencl

1、CUDA和OpenCL的區別 http://blog.sina.com.cn/s/blog_6fb9f559010101bx.html 2、理解OpenCL中的工作組、工作項的索引 https://blog.csdn.net/zhou

原创 NEON_16

矩陣乘法示例 矩陣乘法是在許多數據密集型應用程序中執行的操作。 它由以簡單方式重複的算術運算組組成: 矩陣乘法過程如下: A-在第一個矩陣中進行一行 B-執行該行的點積與第二個矩陣中的一列 C-將結果存儲在新矩陣的相應行和列中 對於32

原创 NEON_13

什麼是NEON? Neon是Arm高級SIMD架構的實現。 Neon的目的是通過提供以下內容來加速數據處理: 32個128位向量寄存器,每個寄存器都可以包含多個數據通道。 SIMD指令可同時在多個數據通道上運行。 可以從Neon技術中受益

原创 NEON_12

總覽 本指南向您展示如何在C或C ++代碼中使用Neon內在函數,以利用Armv8體系結構中的Advanced SIMD技術。 這些簡單的示例演示瞭如何使用這些內在函數,並提供瞭解釋其目的的機會。 目標受衆 希望使用Advanced SI

原创 模版片特化的特殊用法

https://www.cnblogs.com/my_life/articles/10143048.html

原创 opencv mat

1、Opencv中用at 與用ptr 的不同 https://blog.csdn.net/an_meng/article/details/49912585 2、opencv中Mat數據類型中data、size、depth、channels

原创 opencv core

1、LUT https://blog.csdn.net/anjisi/article/details/53899222

原创 VS_OPENCV

Visual Studio 項目中相對路徑的設置 https://blog.csdn.net/li1014269733/article/details/89209399 To disable deprecation,,use _CRT_S

原创 OpenCV Parallel

OpenCV並行加速Parallel_for_與ParallelLoopBody教程 https://blog.csdn.net/qq_27825451/article/details/103878676

原创 Cascading Convolutional Color Constancy

Abstract 在計算色彩恆常性中,將場景的光照從物體的表象中迴歸是一種普遍採用的方法。然而,由於光源未知、材料的反射性質不同、外部成像因素(如不同的相機傳感器)等原因造成的固有外觀和標籤的模糊性,仍然是一個具有挑戰性的問題。在本文中,

原创 optimizer.zero_grad()

optimizer.zero_grad()意思是把梯度置零,也就是把loss關於weight的導數變成0. 在學習pytorch的時候注意到,對於每個batch大都執行了這樣的操作: # zero the paramet

原创 torch.mean

mean()函數的參數:dim=0,按行求平均值,返回的形狀是(1,列數);dim=1,按列求平均值,返回的形狀是(行數,1),默認不設置dim的時候,返回的是所有元素的平均值。 x=torch.arange(12).view(4,3)

原创 NEON博客彙總

1、neon內部函數 https://blog.csdn.net/emsoften/article/details/51718763 2、NEON指令集綜述 https://blog.csdn.net/charleslei/article

原创 NEON_14

爲什麼要使用內在函數? 內在函數是編譯器知道其精確實現的函數。 Neon內部函數是arm_neon.h中定義的一組C和C ++函數,Arm編譯器和GCC支持這些函數。 這些功能使您可以使用Neon,而不必直接編寫彙編代碼,因爲這些函數本身

原创 NEON_17

程序約定 宏 爲了使用內部函數,必須支持Advanced SIMD體系結構,並且在任何情況下都可能啓用或不啓用某些特定的指令。 定義以下宏且等於1時,相應的功能可用:   __ARM_NEON 編譯器支持高級SIMD AArch64始終爲