1、漢字在數據庫中佔幾個字節
答:UTF-8 編碼漢字佔用2-4個字節,GBK編碼漢字佔用2個字節
解析
Unicode規則:將世界上所有的符號都納入其中。每一個符號都給予一個獨一無二的編碼
UTF-8就是在互聯網上使用最廣的一種Unicode的實現方式。UTF-8是一種變長的編碼方式。它使用1~6個字節表示一個符號,根據不同的符號而變化字節長度,目前只用到1-4個字節表示全世界100多萬個字符。
UTF-8 編碼:
佔2個字節的漢字:〇
佔3個字節的:基本等同於GBK,含21000多個漢字
佔4個字節的:中日韓超大字符集裏面的漢字,有5萬多個
一個utf8數字或英文佔1個字節
GBK編碼: 一個漢字佔2個字節,英文或數字佔一個字節
總結:UTF-8 編碼漢字佔用2-4個字節,GBK編碼漢字佔用2個字