mysql亂碼問題(轉自csdn)

原創

2018-08-26 21:11

亂碼產生原因 (我用的5.0)

mysql字符編碼是版本4.1引入的,支持多國語言,而且一些特性已經超過了其他的數據庫系統。

可以在MySQL Command Line Client 下輸入如下命令查看mysql的字符集

mysql> SHOW CHARACTER SET;
+----------+-----------------------------+---------------------+--------+
| Charset  | Description                | Default collation | Maxlen |
+----------+-----------------------------+---------------------+--------+
| big5    | Big5 Traditional Chinese | big5_chinese_ci    | 2    |
| dec8    | DEC West European          | dec8_swedish_ci    | 1    |
| cp850 | DOS West European          | cp850_general_ci | 1    |
| hp8    | HP West European          | hp8_english_ci    | 1    |
| koi8r | KOI8-R Relcom Russian    | koi8r_general_ci | 1    |
| latin1 | cp1252 West European       | latin1_swedish_ci | 1    |
| latin2 | ISO 8859-2 Central European | latin2_general_ci | 1    |
| swe7    | 7bit Swedish             | swe7_swedish_ci    | 1    |
| ascii | US ASCII                   | ascii_general_ci | 1    |
| ujis    | EUC-JP Japanese          | ujis_japanese_ci | 3    |
| sjis    | Shift-JIS Japanese       | sjis_japanese_ci | 2    |
| hebrew | ISO 8859-8 Hebrew          | hebrew_general_ci | 1    |
| tis620 | TIS620 Thai                | tis620_thai_ci    | 1    |
| euckr | EUC-KR Korean             | euckr_korean_ci    | 2    |
| koi8u | KOI8-U Ukrainian          | koi8u_general_ci | 1    |
| gb2312 | GB2312 Simplified Chinese | gb2312_chinese_ci | 2    |
| greek | ISO 8859-7 Greek          | greek_general_ci | 1    |
| cp1250 | Windows Central European | cp1250_general_ci | 1    |
| gbk    | GBK Simplified Chinese    | gbk_chinese_ci    | 2    |
| latin5 | ISO 8859-9 Turkish       | latin5_turkish_ci | 1    |
| armscii8 | ARMSCII-8 Armenian       | armscii8_general_ci | 1    |
| utf8    | UTF-8 Unicode             | utf8_general_ci    | 3    |
| ucs2    | UCS-2 Unicode             | ucs2_general_ci    | 2    |
| cp866 | DOS Russian                | cp866_general_ci | 1    |
| keybcs2  | DOS Kamenicky Czech-Slovak  | keybcs2_general_ci  | 1    |
| macce | Mac Central European       | macce_general_ci | 1    |
| macroman | Mac West European          | macroman_general_ci | 1    |
| cp852 | DOS Central European       | cp852_general_ci | 1    |
| latin7 | ISO 8859-13 Baltic       | latin7_general_ci | 1    |
| cp1251 | Windows Cyrillic          | cp1251_general_ci | 1    |
| cp1256 | Windows Arabic             | cp1256_general_ci | 1    |
| cp1257 | Windows Baltic             | cp1257_general_ci | 1    |
| binary | Binary pseudo charset    | binary             | 1    |
| geostd8  | GEOSTD8 Georgian          | geostd8_general_ci  | 1    |
| cp932 | SJIS for Windows Japanese | cp932_japanese_ci | 2    |
| eucjpms  | UJIS for Windows Japanese | eucjpms_japanese_ci | 3    |
+----------+-----------------------------+---------------------+--------+
36 rows in set (0.02 sec)

MySQL 4.1的字符集支持(Character Set Support)有兩個方面：字符集(Character set)和排序方式(Collation)。對於字符集的支持細化到四個層次: 服務器(server)，數據庫(database)，數據表(table)和連接(connection)。
查看系統的字符集和排序方式的設定可以通過下面的兩條命令：

mysql> SHOW VARIABLES LIKE 'character_set_%';
+--------------------------+-------------------------------------------+
| Variable_name          | Value                                  |
+--------------------------+-------------------------------------------+
| character_set_client    | latin1                                  |
| character_set_connection | latin1                                  |
| character_set_database | latin1                                  |
| character_set_filesystem | binary                                  |
| character_set_results | latin1                                  |
| character_set_server    | latin1                                  |
| character_set_system    | utf8                                     |
| character_sets_dir    | D:/MySQL/MySQL Server 5.0/share/charsets/ |
+--------------------------+-------------------------------------------+
8 rows in set (0.06 sec)

mysql> SHOW VARIABLES LIKE 'collation_%';
+----------------------+-------------------+
| Variable_name       | Value          |
+----------------------+-------------------+
| collation_connection | latin1_swedish_ci |
| collation_database | latin1_swedish_ci |
| collation_server    | latin1_swedish_ci |
+----------------------+-------------------+
3 rows in set (0.02 sec)

上面列出的值就是系統的默認值。latin1默認校對規則是latin1_swedish_ci，默認是latin1的瑞典語排序方式. 爲什麼呢默認會是latin1_swedish_ci呢,追溯一下mysql歷史很容易發現.

1979 年，一家瑞典公司Tcx欲開發一個快速的多線程、多用戶數據庫系統。Tcx 公司起初想利用mSQL和他們自己的快速低級例程 (Indexed Sequential Access Method，ISAM)去連接數據庫表，然而，在一些測試以後得出結論：mSQL對其需求來說不夠快速和靈活。這就產生了一個連接器數據庫的新SQL接口，它使用幾乎和mSQL一樣的API接口。這個API被設計成可以使那些由mSQL而寫的第三方代碼更容易地移植到MySQL。

當然也可以需要修改mysql的默認字符集
在mysql配置文檔my.ini，找到如下兩句：

[mysql]

default-character-set=latin1

和

# created and no character set is defined
default-character-set=latin1

修改後面的值就可以。

這裏不建議改，仍保留默認值
也就是說啓動 mysql時，如果沒指定指定一個默認的的字符集，這個值繼承自配置文件中的；
此時 character_set_server 被設定爲這個默認的字符集；當創建一個新的數據庫時，
除非明確指定，這個數據庫的字符集被缺省設定爲 character_set_server；當選定了一個數據庫時，
character_set_database 被設定爲這個數據庫默認的字符集；在這個數據庫裏創建一張表時，
表默認的字符集被設定爲 character_set_database，也就是這個數據庫默認的字符集；
當在表內設置一欄時，除非明確指定，否則此欄缺省的字符集就是表默認的字符集。

這樣問題就隨之而來了，假如一數據庫是gbk編碼。如果訪問數據庫時沒指定其的字符集是gbk。
那麼這個值將繼承系統的latin1，這樣就做成mysql中文亂碼。

亂碼解決方法

要解決亂碼問題，首先必須弄清楚數據庫用什麼編碼。如果沒有指明，將是默認的latin1。
用得最多的應該是這3種字符集 gb2312，gbk，utf8。

如何去指定數據庫的字符集呢？下面也gbk爲例

【在MySQL Command Line Client創建數據庫】

mysql> CREATE TABLE `mysqlcode` (
-> `id` TINYINT( 255 ) UNSIGNED NOT NULL AUTO_INCREMENT PRIMARY KEY ,
-> `content` VARCHAR( 255 ) NOT NULL
-> ) TYPE = MYISAM CHARACTER SET gbk COLLATE gbk_chinese_ci;
Query OK, 0 rows affected, 1 warning (0.03 sec)

mysql> desc mysqlcode;
+---------+-----------------------+------+-----+---------+----------------+
| Field | Type                | Null | Key | Default | Extra       |
+---------+-----------------------+------+-----+---------+----------------+
| id    | tinyint(255) unsigned | NO | PRI |       | auto_increment |
| content | varchar(255)       | NO |    |       |             |
+---------+-----------------------+------+-----+---------+----------------+
2 rows in set (0.02 sec)

其中後面的TYPE = MYISAM CHARACTER SET gbk COLLATE gbk_chinese_ci;
就是指定數據庫的字符集，COLLATE (校勘)，讓mysql同時支持多種編碼的數據庫。

當然也可以通過如下指令修改數據庫的字符集
alter database da_name default character set 'charset'.

客戶端以 gbk格式發送，可以採用下述配置:

SET character_set_client='gbk'
SET character_set_connection='gbk'
SET character_set_results='gbk'

這個配置就等價於 SET NAMES 'gbk'。

現在對剛纔創建的數據庫操作

mysql> use test;
Database changed

mysql> insert into mysqlcode values(null,'php愛好者');
ERROR 1406 (22001): Data too long for column 'content' at row 1

沒有指定字符集爲gbk，插入時出錯

mysql> set names 'gbk';
Query OK, 0 rows affected (0.02 sec)

指定字符集爲 gbk

mysql> insert into mysqlcode values(null,'php愛好者');
Query OK, 1 row affected (0.00 sec)

插入成功

mysql> select * from mysqlcode;
+----+-----------+
| id | content |
+----+-----------+
| 1  | php愛好着 |
+----+-----------+
1 row in set (0.00 sec)

在沒有指定字符集gbk時讀取也會出現亂碼，如下

mysql> select * from mysqlcode;
+----+---------+
| id | content |
+----+---------+
| 1  | php???  |
+----+---------+
1 row in set (0.00 sec)

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

容器運行時Containerd

sudo ctr image import image.tar #導入docker鏡像 sudo ctr image list #顯示鏡像列表 sudo ctr containers list #列出容器列表

2024-05-12 14:32:51

Shopify Theme 開發 —— 性能優化

一、概述關於 Shopify Theme 的性能優化，通常有以下幾點： 1、卸載未使用的應用程序有些 app 會在 theme 裏面插入一些代碼，即使 app 未被使用，也可能會加載一些腳本文件，影響頁面渲染速度，所以建議不使用的 ap

2024-05-12 14:28:51

爬蟲selenium解決網頁空白問題

from selenium.webdriver import Chrome import time # https://blog.csdn.net/zhoukeguai/article/details/113247342 # driver

張博的博客

2024-05-12 14:25:11

接口請求軟件, 後端必備

apifox, 完全免費軟件, 比postman好用, 性能高, 推薦給每一個童鞋.

張博的博客

2024-05-12 14:25:11

Python 潮流週刊#50：我最喜歡的 Python 3.13 新特性！

本週刊由 Python貓出品，精心篩選國內外的 250+ 信息源，爲你挑選最值得分享的文章、教程、開源項目、軟件工具、播客和視頻、熱門話題等內容。願景：幫助所有讀者精進 Python 技術，並增長職業和副業的收入。本期分享了 12 篇文

豌豆花下貓

2024-05-12 14:24:30

vue綁定對象，綁定的值不改變的問題

在使用vue結合elmentui的table組件，對數組綁定，需要編輯數組裏一些屬性的值。我的情況是，需要在打開這個表時，根據條件插入一些對象到table裏，經測試，到這裏是沒問題的，可以顯示新插入的對象。問題在於，當我改變這些新插入對象的

2024-05-12 14:22:30

PLY文件格式及cpp解析

PLY (Polygon File Format, 多邊形文件格式)文件用於存儲Geometry Object Data(包括vertices, face and other element頂點/面片/其它屬性) 文件格式： Header

2024-05-12 14:18:50

UBUNTU無法上網的解決

一.網絡圖標不見的應對方法1、刪除NetworkManager緩存文件service NetworkManager stop rm /var/lib/NetworkManager/NetworkManager.state service N

2024-05-12 14:18:40

前端使用 Konva 實現可視化設計器（10）- 對齊線

請大家動動小手，給我一個免費的 Star 吧~ 大家如果發現了 Bug，歡迎來提 Issue 喲~ github源碼 gitee源碼示例地址不知不覺來到第 10 章了，感覺接近尾聲了。。。對齊線先看效果：這裏交互有兩個部分：

2024-05-12 14:13:19

AFL漏洞挖掘技術漫談（一）：用AFL開始你的第一次Fuzzing

https://www.freebuf.com/articles/system/191543.html 一、前言模糊測試（Fuzzing）技術作爲漏洞挖掘最有效的手段之一，近年來一直是衆多安全研究人員發現漏洞的首選技術。AFL、LibFu

2024-05-12 14:11:19

使用c#強大的表達式樹實現對象的深克隆

一、表達式樹的基本概念表達式樹是一個以樹狀結構表示的表達式，其中每個節點都代表表達式的一部分。例如，一個算術表達式 a + b 可以被表示爲一個樹，其中根節點是加法運算符，它的兩個子節點分別是 a 和 b。在 LINQ（語言集成查詢）中，

2024-05-12 14:10:39

SQL SERVER 數據庫清空語句忽略外鍵觸發器等（轉載）

有時候我們想清空SQL Server中所有表的數據，但是由於有外鍵約束和觸發器，有時候清表語句無法執行，下面的語句可以關掉和開啓一個數據庫中的所有外鍵約束和觸發器，以便執行清表語句： USE ClothesShop EXECUTE sp

2024-05-12 14:08:28

從零手寫實現 tomcat-11-filter 過濾器

創作緣由平時使用 tomcat 等 web 服務器不可謂不多，但是一直一知半解。於是想着自己實現一個簡單版本，學習一下 tomcat 的精髓。系列教程從零手寫實現 apache Tomcat-01-入門介紹從零手寫實現 apach

2024-05-12 14:04:58

Java開發利器Commons Lang之元組Tuple

標準Java庫沒有提供足夠的方法來操作其核心類，Apache Commons Lang提供了這些額外的方法。 Apache Commons Lang爲java提供了大量的幫助工具。lang API，特別是String操作方法、基本數值

2024-05-12 14:03:48

詐騙（殺豬盤）網站進行滲透測試

今天朋友突然告訴我，某轉買手機被騙了1200塊錢，心理一驚，果然不出所料，那我來試試吧。要來了詐騙網站地址，打開是這種：果斷收集一下信息：（由於留言騙子返還朋友錢款，暫時給他留點面子，打點馬賽克）查看端口，一猜就是寶塔面板搭建開着80，

斑林鴿的代碼世界

2024-05-12 14:02:58

24小時熱門文章

最新文章

最新評論文章