LPTSTR、LPCSTR、LPCTSTR、LPSTR的來源及意義

UNICODE:它是用兩個字節表示一個字符的方法。比如字符'A'在ASCII下面是一個字符,可'A'在UNICODE下面是兩個字符,高字符用0填充,而且漢字'程'在ASCII下面是兩個字節,而在UNICODE下仍舊是兩個字節
。UNICODE的用處就是定長表示世界文字,據統計,用兩個字節可以編碼現存的所有文字而沒有二義。
   
MBCS,它是多字節字符集,它是不定長表示世界文字的編碼。MBCS表示英文字母時就和ASCII一樣(這也是我們容易把MBCS和ASCII搞混的原因),但表示其他文字時就需要用多字節。 

WINDOWS下面的程序設計可以支持MBCS和UNICODE兩種編碼的字符串,具體用那種就看你定義了MBCS宏還是UNICODE宏。MBCS宏對應的字符串指針是char*也就是LPSTR,UNICODE對應的指針是unsigned   short*也就是LPWSTR,爲了寫程序方便微軟定義了類型LPTSTR,在MBCS下他就是char*,   在UNICODE下它是unsigned   char*,這樣你就可以重定義一個宏進行不同字符集的轉換了。
LPTSTR、LPCSTR、LPCTSTR、LPSTR的意義:
LPSTR:32bit指針 指向一個字符串,每個字符佔1字節
LPCSTR:32-bit指針 指向一個常字符串,每個字符佔1字節
LPCTSTR:32-bit指針 指向一個常字符串,每字符可能佔1字節或2字節,取決於Unicode是否定義
LPTSTR:32-bit指針 每字符可能佔1字節或2字節,取決於Unicode是否定義
Windows使用兩種字符集ANSI和UNICODE,前者就是通常使用的單字節方式,但這種方式處理象中文這樣的雙字節字符不方便,容易出現半個漢字的情況。而後者是雙字節方式,方便處理雙字節字符。
WindowsNT的所有與字符有關的函數都提供兩種方式的版本,而Windows9x只支持ANSI方式。_T一般同字常數相關,如_T("Hello"。如果你編譯一個程序爲ANSI方式,_T實際不起任何作用。而如果編譯一個程序爲UNICODE方式,則編譯器會把"Hello"字符串以UNICODE方式保存。_T和_L的區別在於,_L不管你是以什麼方式編譯,一律UNICODE方式保存.
Windows核心編程的第一章。
L是表示字符串資源爲Unicode的。
比如
wchar_t Str[] = L"Hello World!";
這個就是雙子節存儲字符了。
_T是一個適配的宏~

#ifdef _UNICODE的時候
_T就是L
沒有#ifdef _UNICODE的時候
_T就是ANSI的。
比如
LPTSTR lpStr = new TCHAR[32];
TCHAR* szBuf = _T("Hello");
以上兩句使得無論是在UNICODE編譯條件下都是正確編譯的。
而且MS推薦你使用相匹配的字符串函數。
比如處理LPTSTR或者LPCTSTR 的時候,不要用strlen ,而是要用_tcslen
否則在UNICODE的編譯條件下,strlen不能處理 wchar_t*的字符串。
T是非常有意思的一個符號(TCHAR、LPCTSTR、LPTSTR、_T()、_TEXT()...),它表示使用一種中間類型,既不明確表示使用 MBCS,也不明確表示使用 UNICODE。那到底使用哪種字符集?編譯的時候才決定
 

 
在vc++中有着各種字符串的表示法,如您所說。        
首先char*   是指向ANSI字符數組的指針,其中每個字符佔據8位(有效數據是除掉最高位的其他7位),這裏保持了與傳統的C,C++的兼容。      
 LP的含義是長指針(long   pointer)。
LPSTR是一個指向以‘’結尾的ANSI字符數組的指針,與char*可以互換使用,在win32中較多地使用LPSTR。而LPCSTR中增加的‘C’的含義是“CONSTANT”(常量),表明這種數據類型的實例不能被使用它的API函數改變,除此之外,它與LPSTR是等同的。    
    爲了滿足程序代碼國際化的需要,業界推出了Unicode標準,它提供了一種簡單和一致的表達字符串的方法,所有字符中的字節都是16位的值,其數量也可以滿足差不多世界上所有書面語言字符的編碼需求,開發程序時使用Unicode(類型爲wchar_t)是一種被鼓勵的做法。    
    LPWSTR與LPCWSTR由此產生,它們的含義類似於LPSTR與LPCSTR,只是字符數據是16位的wchar_t而不是char。       
 然後爲了實現兩種編碼的通用,提出了TCHAR的定義:   
如果定義_UNICODE,聲明如下:     typedef   wchar_t   TCHAR;    
如果沒有定義_UNICODE,則聲明如下:     typedef   char   TCHAR;     
LPTSTR和LPCTSTR中的含義就是每個字符是這樣的TCHAR。       
CString類中的字符就是被聲明爲TCHAR類型的,它提供了一個封裝好的類供用戶方便地使用。
如果您還需要進一步的信息,請參看http://msdn.microsoft.com/library/default.asp?url=/library/en-us/vclib/html/_crt_data_type_mappings.asp等其他有關信息。
發佈了16 篇原創文章 · 獲贊 8 · 訪問量 3萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章