MySQL的UTF-8編碼方式

MySQL 從 4.1 版本開始支持 UTF-8，也就是 2003 年，然而目前流行的UTF-8 標準（RFC 3629）是在此之後規定的。正因此，才造就了MySQL中的UTF-8與我們日常開發中的UTF-8不一致，從到導致了些問題。MySQL的UTF-8只支持每個字符最多三個字節，而真正的 UTF-8 是每個字符最多四個字節。

問題復現

有數據庫表如下：utf8編碼方式

往數據庫存一條記錄：

@Test
public void testInsert() {
    User user = new User();
    user.setUsername("\uD83D\uDE00 ");
    user.setPassword("123456");
    userRepo.save(user);
}
複製代碼

這裏只是部分代碼，看不懂沒關係，這裏是給user表插入一條記錄。其中username是\uD83D\uDE00 。

其實\uD83D\uDE00是一個emoji表情。

因爲MySQL中utf8字符集只支持三字節UTF-8編碼的Unicode範圍，而emoji字符屬於四字節編碼部分，所以程序運行預期是會報錯的。運行這段代碼：

與預期一致，報錯了。

解決問題

雖然MySQL的UTF-8存在缺陷，但是MySQL（包括mariadb）官方卻沒有修復此bug，而是通過2010年重新發布的“utf8mb4”來支持真正的 UTF-8。因此想要解決此問題，只能夠將MySQL數據庫設置爲utf8mb4字符集才行。

總結

這個問題，也是因爲某次保存數據的時候保存了一個emoji表情才發現的。其實最早開始用MySQL的時候，就有發現一個utf8mb4了，但是自己卻沒有卻去了解UTF8和UTF8MB4的區別。通過此次教訓，以後使用MySQL就老老實實的設置字符集爲utf8mb4吧。

轉載於:https://juejin.im/post/5d08f6a0f265da1bc07e3c53

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

爲什麼不要在MySQL中使用UTF-8編碼方式

MySQL的UTF-8編碼方式

問題復現

解決問題

總結

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

關於接口協議，你必須要知道這些！

FolkMq v1.4.6 發佈（可以內嵌的消息中間件）

一鍵自動化博客發佈工具,用過的人都說好(頭條篇)

01 穩定性（一）如何應對事故並做好覆盤？

美團一面：項目中有 10000 個 if else 如何優化？想了半天，被問懵了！

線程池那些坑爹的參數-核心線程數&最大線程數&工作隊列

京東面試：如何進行JVM調優？

Stream流常用方法總結

卷積神經網絡（基礎知識回顧）-第七講

一鍵U盤裝系統

Android上安裝第三方庫

neutron dhcp高可用bug修復

怎樣纔算會一門編程語言

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結