SSE指令的使用學習

原文地址:https://blog.csdn.net/a200800170331/article/details/48706695

1. 什麼是指令集?

指令集是爲了增強CPU在某些方面(如多媒體)的功能而特意開發出的一組程序代碼集合。

2.常見的指令集有哪些呢?

1)MMX(Multi-Media Extensions,做媒體擴展)指令集:Intel1996年推出的一項多媒體指令增強技術。共包含57條多媒體指令,這些指令一次可以處理多個數據。

2)SSE(StreamingSIMD Extensions,單指令多數據留擴展)數據集:包含70條指令,其中有50條SIMD(單指令多數據技術)浮點運算指令,12條MMX整數運算增強指令,8條優化內存中連續數據塊的傳輸指令。理論上這些指令對目前流行的圖像處理、浮點處理、3D運算、視頻處理、音頻處理等多媒體應用起到全面強化的作用。

注意:SSE指令和3DNow!指令彼此互不兼容,但SSE包含了3DNow!的絕大多數功能。

3)SSE2、SSE3、SSE4是SSE的擴展技術。

4)3DNow!指令集。

3.Visual Studio使用SSE需要添加對應的頭文件:
原因:加入頭文件可以將彙編形式的指令集封裝成C語言形式,可增強可讀性以及可維護性。

mmintrin.h------>MMX

xmmintrin.h------>SSE

emmintrin.h------>SSE2

pmmintrin.h------>SSE3

有了這些頭文件的支持,在我們的代碼中便可以調用指令集函數的程序。

但是這些函數必須獲得硬件CPU的支持,我們如何才能確保我們的計算機可以調用這些指令集呢?

可以使用一個叫做CPU-Z的工具自己對你的CPU的各種參數進行查詢:

所謂CPU-Z是一款CPU檢測軟件,包括檢測CPU的處理器、內存、顯卡等等,(挺好用的!)

其界面如下,大致功能也可以一目瞭然:

4.加載了頭文件便可使用SSE的指令了,那麼SSE指令和數據有什麼特點呢?

SSE指令的函數名稱一般定義爲:_m_operation() ;

SSE的數據類型:__m128

PS:需要注意因爲SSE的數據類型的固有特點,所以SSE指令要求數據的地址是16字節對齊的,怎麼把我們給定的數據轉化成該類型,需要使用_mm_load_ps(float const * _A)加以實現,該函數的原型:extern __m128 _mm_load_ps(float const * _A)

通俗的理解,該函數實現了將float的數組的每四個元素進行組合作爲__m128類型的數據返回,以實現SSE指令函數的數據要求。

在使用該函數時:輸入數據_A應該先被指定爲16字節對齊,實現方法:
__declspec(align(16)) float  Input[4]={1,2,3,4}

在處理完數據以後,用SSE指令完成的數據一般保存在以__m128的形式保存在暫存器裏,爲了後續運算一般需要將其保存會float形式的內存中,此時需要用到函數:

void _mm_storeu_ps(float* p,__m128 a);

一個例子很好的詮釋以上知識點:

 


 
  1. #include "xmmintrin.h"

  2. #include <iostream>

  3. using namespace std;

  4. void main()

  5. {

  6. __declspec(align(16)) float Input1[4]={1,2,3,4};

  7. __declspec(align(16)) float Input2[4]={1,2,3,4};

  8. float *Result;

  9. Result=(float*)_aligned_malloc(sizeof(float)*4,16);

  10. __m128 c;

  11. __m128 a=_mm_load_ps(Input1);

  12. __m128 b=_mm_load_ps(Input2);

  13. c=_mm_add_ps(a,b);

  14. _mm_storeu_ps(Result,c);

  15. cout<<Input1[0]<<" "<<Input1[1]<<" " <<Input1[2]<<" "<<Input1[3]<<endl;

  16. cout<<a.m128_f32[0]<<" "<<a.m128_f32[1]<<" " <<a.m128_f32[2]<<" "<<a.m128_f32[3]<<endl;

  17. cout<<c.m128_f32[0]<<" "<<c.m128_f32[1]<<" " <<c.m128_f32[2]<<" "<<c.m128_f32[3]<<endl;

  18. for(int i=0;i<4;i++)

  19. {

  20. cout<<Result[i]<<" ";

  21. }

  22. cout<<endl;

  23. _aligned_free(Result);

  24. return;

  25. }

代碼結果:

 

5.怎麼知道SSE有哪些可用的函數呢?

打開頭文件“xmmintrin.h”,通過命名很容易推測出函數的應用目的。

參考:

1) http://blog.csdn.net/gengshenghong/article/details/7007100

2) http://blog.csdn.net/gengshenghong/article/details/7008704

3)http://blog.csdn.net/gengshenghong/article/details/7010615

4)http://blog.csdn.net/gengshenghong/article/details/7011373

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章