原文地址:https://blog.csdn.net/a200800170331/article/details/48706695
1. 什麼是指令集?
指令集是爲了增強CPU在某些方面(如多媒體)的功能而特意開發出的一組程序代碼集合。
2.常見的指令集有哪些呢?
1)MMX(Multi-Media Extensions,做媒體擴展)指令集:Intel1996年推出的一項多媒體指令增強技術。共包含57條多媒體指令,這些指令一次可以處理多個數據。
2)SSE(StreamingSIMD Extensions,單指令多數據留擴展)數據集:包含70條指令,其中有50條SIMD(單指令多數據技術)浮點運算指令,12條MMX整數運算增強指令,8條優化內存中連續數據塊的傳輸指令。理論上這些指令對目前流行的圖像處理、浮點處理、3D運算、視頻處理、音頻處理等多媒體應用起到全面強化的作用。
注意:SSE指令和3DNow!指令彼此互不兼容,但SSE包含了3DNow!的絕大多數功能。
3)SSE2、SSE3、SSE4是SSE的擴展技術。
4)3DNow!指令集。
3.Visual Studio使用SSE需要添加對應的頭文件:
原因:加入頭文件可以將彙編形式的指令集封裝成C語言形式,可增強可讀性以及可維護性。
mmintrin.h------>MMX
xmmintrin.h------>SSE
emmintrin.h------>SSE2
pmmintrin.h------>SSE3
有了這些頭文件的支持,在我們的代碼中便可以調用指令集函數的程序。
但是這些函數必須獲得硬件CPU的支持,我們如何才能確保我們的計算機可以調用這些指令集呢?
可以使用一個叫做CPU-Z的工具自己對你的CPU的各種參數進行查詢:
所謂CPU-Z是一款CPU檢測軟件,包括檢測CPU的處理器、內存、顯卡等等,(挺好用的!)
其界面如下,大致功能也可以一目瞭然:
4.加載了頭文件便可使用SSE的指令了,那麼SSE指令和數據有什麼特點呢?
SSE指令的函數名稱一般定義爲:_m_operation() ;
SSE的數據類型:__m128
PS:需要注意因爲SSE的數據類型的固有特點,所以SSE指令要求數據的地址是16字節對齊的,怎麼把我們給定的數據轉化成該類型,需要使用_mm_load_ps(float const * _A)加以實現,該函數的原型:extern __m128 _mm_load_ps(float const * _A)
通俗的理解,該函數實現了將float的數組的每四個元素進行組合作爲__m128類型的數據返回,以實現SSE指令函數的數據要求。
在使用該函數時:輸入數據_A應該先被指定爲16字節對齊,實現方法:
__declspec(align(16)) float Input[4]={1,2,3,4}
在處理完數據以後,用SSE指令完成的數據一般保存在以__m128的形式保存在暫存器裏,爲了後續運算一般需要將其保存會float形式的內存中,此時需要用到函數:
void _mm_storeu_ps(float* p,__m128 a);
一個例子很好的詮釋以上知識點:
-
#include "xmmintrin.h"
-
#include <iostream>
-
using namespace std;
-
void main()
-
{
-
__declspec(align(16)) float Input1[4]={1,2,3,4};
-
__declspec(align(16)) float Input2[4]={1,2,3,4};
-
float *Result;
-
Result=(float*)_aligned_malloc(sizeof(float)*4,16);
-
__m128 c;
-
__m128 a=_mm_load_ps(Input1);
-
__m128 b=_mm_load_ps(Input2);
-
c=_mm_add_ps(a,b);
-
_mm_storeu_ps(Result,c);
-
cout<<Input1[0]<<" "<<Input1[1]<<" " <<Input1[2]<<" "<<Input1[3]<<endl;
-
cout<<a.m128_f32[0]<<" "<<a.m128_f32[1]<<" " <<a.m128_f32[2]<<" "<<a.m128_f32[3]<<endl;
-
cout<<c.m128_f32[0]<<" "<<c.m128_f32[1]<<" " <<c.m128_f32[2]<<" "<<c.m128_f32[3]<<endl;
-
for(int i=0;i<4;i++)
-
{
-
cout<<Result[i]<<" ";
-
}
-
cout<<endl;
-
_aligned_free(Result);
-
return;
-
}
代碼結果:
5.怎麼知道SSE有哪些可用的函數呢?
打開頭文件“xmmintrin.h”,通過命名很容易推測出函數的應用目的。
參考:
1) http://blog.csdn.net/gengshenghong/article/details/7007100
2) http://blog.csdn.net/gengshenghong/article/details/7008704
3)http://blog.csdn.net/gengshenghong/article/details/7010615
4)http://blog.csdn.net/gengshenghong/article/details/7011373