數據庫常識——漢字在數據庫中佔幾個字節

1、漢字在數據庫中佔幾個字節

答:UTF-8 編碼漢字佔用2-4個字節,GBK編碼漢字佔用2個字節

解析

Unicode規則:將世界上所有的符號都納入其中。每一個符號都給予一個獨一無二的編碼

       UTF-8就是在互聯網上使用最廣的一種Unicode的實現方式。UTF-8是一種變長的編碼方式。它使用1~6個字節表示一個符號,根據不同的符號而變化字節長度,目前只用到1-4個字節表示全世界100多萬個字符。

UTF-8 編碼

       佔2個字節的漢字:〇

       佔3個字節的:基本等同於GBK,含21000多個漢字

       佔4個字節的:中日韓超大字符集裏面的漢字,有5萬多個

       一個utf8數字或英文佔1個字節

GBK編碼: 一個漢字佔2個字節,英文或數字佔一個字節

總結:UTF-8 編碼漢字佔用2-4個字節,GBK編碼漢字佔用2個字

 

發佈了32 篇原創文章 · 獲贊 2 · 訪問量 6333
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章