NEON_7

原創

2020-03-13 16:55

爲什麼要依靠編譯器進行自動矢量化？
編寫經過手動優化的彙編內核或包含Neon內部函數的C代碼，可以對軟件中的Neon代碼進行高度控制。但是，這些方法可能導致大量的可移植性和工程複雜性成本。

在許多情況下，高質量的編譯器可以生成同樣好的代碼，但是所需的設計時間卻少得多。允許編譯器自動識別代碼中使用Advanced SIMD指令的機會的過程稱爲自動向量化。

在特定的編譯技術方面，自動向量化包括：

循環矢量化：展開循環以減少迭代次數，同時在每個迭代中執行更多操作。
超字級並行（SLP）矢量化：將標量運算捆綁在一起，以使用全寬Advanced SIMD指令。
自動向量化編譯器包括Arm編譯器6，Arm C / C ++編譯器，LLVM-clang和GCC。

依靠編譯器自動向量化的好處包括：

只要沒有特定於體系結構的代碼元素（如內聯彙編或內部函數），就可以使用高級語言實現的程序是可移植的。
現代編譯器能夠自動執行高級優化。
以給定的微體系結構爲目標就像設置單個編譯器選項一樣容易，而優化彙編程序則需要對目標硬件有深入的瞭解。

使用編譯器生成Neon代碼適合大多數項目。僅當生成的代碼無法提供必要的性能時，或者高級語言不支持特定的硬件功能時，其他利用Neon的方法纔有必要。例如，必須在彙編代碼中配置系統寄存器以控制浮點功能。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

2020華爲軟件精英挑戰賽熱身賽總結篇

Hello大家好，這裏是西北賽區“讓心跳動次動次”，我是隊長SUN，先說一下成績吧，熱身賽個人排名56，最後兩天從20+掉到60+，官方查重也沒把我救回前50。初賽西北賽區第四，複賽A榜西北賽區第五，B榜5連WA(0%)。據我所

2020-07-06 08:01:58

NEON_16

矩陣乘法示例矩陣乘法是在許多數據密集型應用程序中執行的操作。它由以簡單方式重複的算術運算組組成：矩陣乘法過程如下： A-在第一個矩陣中進行一行 B-執行該行的點積與第二個矩陣中的一列 C-將結果存儲在新矩陣的相應行和列中對於32

2020-06-23 17:34:31

NEON_13

什麼是NEON？ Neon是Arm高級SIMD架構的實現。 Neon的目的是通過提供以下內容來加速數據處理： 32個128位向量寄存器，每個寄存器都可以包含多個數據通道。 SIMD指令可同時在多個數據通道上運行。可以從Neon技術中受益

2020-06-23 17:34:31

NEON_12

總覽本指南向您展示如何在C或C ++代碼中使用Neon內在函數，以利用Armv8體系結構中的Advanced SIMD技術。這些簡單的示例演示瞭如何使用這些內在函數，並提供瞭解釋其目的的機會。目標受衆希望使用Advanced SI

2020-06-23 17:34:20

ARM_NEON_CNN編程 SIMD單指令多數據流 intrinsics指令內聯彙編 CNN卷積網絡優化深度學習優化

ARM_NEON_CNN編程 SIMD單指令多數據流 intrinsics指令內聯彙編 CNN卷積網絡優化深度學習優化博文末尾支持二維碼讚賞哦 _ 本文github 神經網絡arm neon加速實現常用NEON 內置函數記

2020-06-06 17:00:10

漢明距離的NEON版本

2020-05-31 21:04:18

NEON博客彙總

2020-04-13 18:24:27

NEON_14

2020-03-18 03:37:25

NEON_17

2020-03-18 03:37:25

NEON_11

2020-03-18 03:37:25

NEON_15

2020-03-18 03:37:25

NEON_8

2020-03-18 03:37:25

NEON_4

2020-03-13 16:55:29

NEON_3

2020-03-13 16:55:29

NEON_5

2020-03-13 16:55:29

24小時熱門文章

最新文章

最新評論文章