charset

 我們做網頁時,如果指定的 Charset 是 GB2312,那麼就不應該在網頁中出現繁體字,因爲 GB2312 標準只有幾千個簡體的中文字。如果我們的網頁編碼是 UTF-8,我們就不要指定字符集是 GB2312,因爲雖然 UTF-8 編碼對應的 UTF-8 字符集包含了 GB2312 的字符,但同一個字符在兩個字符集中的編號不一樣

下面這些編碼方式,比如:中文 GBK ,繁體中文 Big5 ,日文 EUC-JP ,韓文 EUC-KR 等,每種語言的編碼方式是不同的,所以需要使用charset爲網頁提供了一種編碼方式,否則頁面很可能出現亂碼.
UTF-8 是沒有國家的編碼,也就是獨立於任何一種語言,任何語言都可以使用
UTF-8編碼則是用以解決國際上字符的一種多字節編碼,它對英文使用8位(即一個字節),中文使用24位(三個字節)來編碼。對於英文字符較多的論壇則用UTF-8節省空間。GBK包含全部中文字符;UTF-8則包含全世界所有國家需要用到的字符。GBK是在國家標準GB2312基礎上擴容後兼容GB2312的標準(好像還不是國家標準)UTF-8編碼的文字可以在各國各種支持UTF8字符集的瀏覽器上顯示。比如,如果是UTF8編碼,則在外國人的英文IE上也能顯示中文,而無需他們下載IE的中文語言支持包。 所以,對於英文比較多的論壇 ,使用GBK則每個字符佔用2個字節,而使用UTF-8英文卻只佔一個字節。UTF8是國際編碼,它的通用性比較好,外國人也可以瀏覽論壇,GBK是國家編碼,通用性比UTF8差,不過UTF8佔用的數據庫比GBK大
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章