數據庫中char, varchar, nvarchar的差異

  1. char
    固定長度,最長n個字符。

  2. varchar
    最大長度爲n的可變字符串。
    (n爲某一整數,不同數據庫,最大長度n不同)

char和varchar區別:
varchar必char節省空間,但在效率上比char稍微差一些。
說varchar比char節省空間,是因爲varchar是可變字符串,比如:用varchar(5)存儲字符串“abc”,只佔用3個字節的存儲空間,而用char(5)存儲,則佔用5個字節(“abc ”)。
說varchar比char效率稍差,是因爲,當修改varchar數據時,可能因爲數據長度不同,導致數據遷移(即:多餘I/O)。其中,oracle對此多餘I/O描述的表達是:“行遷移”(Row Migration)。

“行遷移”(Row Migration):
“當一行的記錄初始插入時是可以存儲在一個block中的,由於更新操作導致行增加了,而block的自由空間已經完全滿了,這個時候就產生了行遷移。在這種情況下,oracle將會把整行數據遷移到一個新的block中,oracle會保留被遷移的行的原始指針指向新的存放行數據的block,這就意味着被遷移行的ROW ID是不會改變的。”
其中要解釋一下:block是oracle中最小的數據組織與管理單位,是數據文件磁盤儲存空間單位,也是數據庫I/O最小單位(也就是說,讀和寫都是一個block打大小,所以如果block沒滿時,更新內容長度變更的varchar字段,和更新內容長度沒變的varchar字段,I/O次數是一樣,不存在額外消耗,只有在block滿時,纔會出現額外I/O,所以char和varchar性能之間的性能差異,是相當細微的,絕大多數情況下可以忽略不計,所以上文描述的“稍”差的含義)。
所以,我的開發經驗是:“用varchar完全代替char吧,沒什麼好顧慮的”。

  1. nvarchar
    nvarchar的特性,需要和varchar對比。
    nvarchar和varchar的不同主要是在對於數據的存儲方式上:
    1). varchar:按字節存儲數據
    varchar(6),最多能存儲6個字節的數據,比如:“哈哈哈”,“abcdef”……
    備註:一箇中文字符在數據庫裏佔多少個字節,要看unicode的編碼方式,比如:utf8在mysql上佔3個字節,sqlserver的Chinese_PRC_CI_AS佔2個字節…
    2). nvarchar:按字符存儲數據
    nvarchar(6),最多能存儲6個字符/中文數據,比如:”哈哈哈哈哈哈”,“abcdef”……
    nvarchar(m)最大存儲的實際字節長度=n*m(n跟據編碼方式而定),如果nvarchar存儲的是英文字符,也是根據編碼方式存儲n的字節長度。也就是說,如果用nvarchar存儲英文字符,會浪費一半以上的存儲空間….

總結:
1. char和varchar的性能差距是很小的,可以考慮忽略不計。
2. 在大數據量應用中,使用char和nvarchar有可能導致大量的存儲空間的浪費。

參考文章:
《Row Chaining and Row Migration》
《SQLSERVER char與varchar的性能測試》
作者:hyddd
出處:http://www.cnblogs.com/hyddd/
本文版權歸作者所有,歡迎轉載,演繹或用於商業目的,但是必須說明本文出處(包含鏈接)。

發佈了34 篇原創文章 · 獲贊 41 · 訪問量 6萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章