mysql8数据类型详解

设计mysql表结构的时候,有很多数据类型供我们选择,下面来介绍下mysql8中常用的数据类型。

整数类型

类型 大小 有符号范围 无符号范围
TINYINT 1 字节 -128 to 127 0 to 255
SMALLINT 2 字节 -32768 to 32767 0 to 65535
MEDIUMINT 3 字节 -8388608 to 8388607 0 to 16777215
INT 4 字节 -2147483648 to 2147483647 0 to 4294967295
BIGINT 8 字节 -9223372036854775808 to 9223372036854775807 0 to 18446744073709551615

整数类型有可选的unsigned属性,表示不允许负值,这可以使正数的上限提高一倍(还多1)。有符号和无符号类型使用相同的存储空间,并且具有相同的性能,因此可以根据实际情况选择合适的类型。

mysql可以为整数类型指定宽度,例如INT(11),对大多数应用来说这是没有意义的:它不会限制合法范围,只是规定了mysql的一些交互工具(例如mysql命令行客户端)用来显示字符的个数。对于存储和计算来说,INT(1)和INT(20)是相同的。

实数类型

类型 大小 有符号范围 无符号范围
FLOAT 4字节 -3.402823466E+38 to -1.175494351E-38, 0, and 1.175494351E-38 to 3.402823466E+38 0, and 1.175494351E-38 to 3.402823466E+38
DOUBLE 8字节 -1.7976931348623157E+308 to -2.2250738585072014E-308, 0, and 2.2250738585072014E-308 to 1.7976931348623157E+308 0, and 2.2250738585072014E-308 to 1.7976931348623157E+308
DECIMAL 根据M和D的值 根据M和D的值

注意FLOAT和DOUBLE可表示的范围不是完全连续的浮点数,由于精度的限制,有些极小的小数是表示不了的,浮点相关的内容可以参考我的另一篇文章神奇的二进制(二)浮点数

DECIMAL类型最多允许65个数字,表示为DECIMAL(M,D)的格式。例如DECIMAL(5,2)表示最多保存5个数字,其中2个是小数,表示的范围在-999.99 到 999.99之间。如果小数位数D为0,则DECIMAL值不包含小数点或小数部分。

FLOAT和DOUBLE类型只能使用标准的浮点运算进行近似运算,如果需要精确运算,例如金额计算,则需要使用DECIMAL类型。

因为cpu不支持对DECIMAL的直接计算,所以在mysql5.0以上的版本中,mysql服务器自身实现了DECIMAL的高精度计算。相对而言,cpu直接支持原生的浮点计算,所以浮点计算明显更快。

涉及到金额计算,在数据量比较大的时候,可以考虑用BIGINT代替DECIMAL。例如金额单位精确到分,99.99可以用9999表示,以分为单位存储在BIGINT字段里,这样可以同时避免浮点数计算的不精确和DECIMAL精确计算代价高的问题。

字符串类型

类型 大小 用途
CHAR 0-255 字节 定长字符串
VARCHAR 0-65535 字节 变长字符串
BINARY 0-255 字节 定长二进制
VARBINARY 0-65535 字节 变长二进制
TINYBLOB 0-255 字节 变长二进制
BLOB 0-65535 字节 变长二进制
MEDIUMBLOB 0-16,777,215 字节 变长二进制
LONGBLOB 0-4,294,967,295 or 4GB (232 − 1) 字节 变长二进制
TINYTEXT 0-255 字节 变长字符串
TEXT 0-65535 字节 变长字符串
MEDIUMTEXT 0-16,777,215 字节 变长字符串
LONGTEXT 0-4,294,967,295 or 4GB (232 − 1) 字节 变长字符串
CHAR

CHAR类型是定长的,会根据定义的长度分配空间。当存储CHAR值时,mysql会删除所有的末尾空格。
在这里插入图片描述
CHAR很适合存储很短的字符串,或者所有的值都接近同一个长度,例如,CHAR非常适合存储密码的MD5的值,因为这是一个定长的长度。对于经常变动的数据,CHAR也比VARCHAR更好,因为定长的CHAR类型不容易产生碎片。

对于非常短的列,CHAR比VARCHAR在存储空间上也更有优势,例如用CHAR(1)来存储只有Y和N的值,如果采用单字节字符集只需1个字节,但是VARCHAR(1)却需要2个字节,因为还需要一个记录长度的额外字节。

VARCHAR

VARCHAR用于存储可变长的字符串,它比定长类型更节省空间。VARCHAR需要使用1或2个额外字节记录字符串的长度:如果列的最大长度小于或等于255字节,则只使用1个字节表示,如果列长度大于255字节,则需要使用2个字节表示长度。

假设采用latin字符集,一个VARCHAR(10)的列需要11个字节空间存储,一个VARCHAR(1000)的列则需要1002个字节空间存储,因为需要存储2个字节的长度信息。

哪些情况使用VARCHAR类型比较合适呢?

  • 字符串的列长度比平均长度大很多
  • 列的更新很少,碎片不是问题
  • 使用了想UTF-8这样复杂的字符集,每个字符都使用了不同的字节数进行存储
BINARY和VARBINARY

BINARY和VARBINARY它们存储的是二进制字符串。二进制字符串和常规的字符串非常相似,但是二进制字符串存储的字节码而不是字符。填充也不一样:mysql填充BINARY采用的是 \0(零字节)而不是空格,在检索时也不会去掉填充值。

当需要存储二进制数据时,可以使用 BINARY或VARBINARY,mysql比较二进制字符串时,每次按一个字节,并且根据该字节的数值进行比较。因此二进制比较比字符串比较简单的多,所以也更快。

BLOB和TEXT

BLOB和TEXT都是为了存储很大数据而设计的字符串数据类型,分别采用二进制和字符方式存储。

二进制类型:TINYBLOB,BLOB,MEDIUMBLOB,LONGBLOB

字符类型:TINYTEXT,TEXT,MEDIUMTEXT,LONGTEXT

与其他类型不同,mysql把每个BLOB和TEXT值当做一个独立的对象处理。存储引擎在存储是通常会做特殊处理,当BLOB和TEXT值太大时,InnoDB会使用专门的“外部”存储区域来进行存储,此时每个值在行内需要1~4个字节存储一个指针,然后在外部存储区域存储实际值。

BLOB和TEXT家族之间仅有的不同是,BLOB存储的是二进制数据,没有排序规则和字符集;而TEXT存储的是字符,有排序规则和字符集。

mysql对BLOB和TEXT列进行排序和其他数据类型不同:它只对每个列的前max_sort_length字节而不是整个字符串做排序。如果只需要排序前面的一小部分字符,则可以减少max_sort_length的值,或者使用ORDER BY SUBSTRING(column,length)。

mysql不能将BLOB和TEXT列全部长度的字符串进行索引,也不能使用这些索引消除排序。

日期和时间类型

类型 大小 范围 格式 用途
DATE 3 字节 ‘1000-01-01’ to ‘9999-12-31’ YYYY-MM-DD 日期值
TIME 3 字节 ‘-838:59:59’ to ‘838:59:59’ hh:mm:ss 时间值
YEAR 1 字节 1901 to 2155 YYYY 年份值
DATETIME 8 字节 ‘1000-01-01 00:00:00’ to ‘9999-12-31 23:59:59’ YYYY-MM-DD hh:mm:ss 日期和时间值
TIMESTAMP 4 字节 ‘1970-01-01 00:00:01’ UTC to ‘2038-01-19 03:14:07’ UTC YYYY-MM-DD hh:mm:ss 日期和时间值

DATETIME使用8个字节的存储空间,和时区无关。
TIMESTAMP使用4个字节的存储空间,显示的时间依赖时区,保存了从1970年1月1号午夜(格林尼治标准时间)以来的秒数,它和unix的时间戳相同。TIMESTAMP只能表示从1970年到2038年。

如果插入和更新数据时没有指定TIMESTAMP的值,mysql会默认的更新TIMESTAMP的值当前系统时间。

位数类型

类型 范围
BIT 1 to 64 位

BIT(1)定义一个包含1个位的数据,BIT(2)包含2个位,以此类推,最大长度为64个位。

mysql把BIT当做字符串类型,而不是数字类型。当检索BIT的值时,结果是对应二进制表示的ASCII码转换后的字符,然而在数字上下文场景中检索的时候,会使用二进制表示的数字。

例如,如果存储一个值b’00111001’(十进制的值为57)到BIT(8)的列并检索它时,得到的结果是9(9的ASCII码是57),如果对该字段进行加减,则返回结果57。
在这里插入图片描述

JSON类型

mysql8支持直接存储json格式字符串,对应的是json数据类型。

  • json数据列会自动验证json的数据格式,如果格式不正确会报错。
  • 最优化存储格式。json数据类型会把json格式的字符串转换成内部格式,能够快速的读取其中的元素。

在这里插入图片描述对应json数据类型的操作方法有JSON_SET(), JSON_REPLACE(), JSON_REMOVE() 等,详情请见官方文档https://dev.mysql.com/doc/refman/8.0/en/json.html。

小结

mysql设计表的数据类型的时候,下面几个简单的原则有助于设计出好的数据类型:

  • 更小的更好
    选择你认为不会超越范围的最小类型,更小的数据类型通常更快,因为它们占用更少的磁盘、内存和cpu缓存,并且处理时需要的cpu周期更少。
  • 简单就好
    简单的数据类型操作通常更快,例如整形的操作比字符串更快,因为字符串有字符集和校对规则(排序规则)比整形更复杂。
  • 尽量避免null
    如果字段可以不存储null值,尽量把字段设置成not null。因为可为null的列使得索引、索引统计和值比较都更复杂,可为null的列会使用更多的存储空间,在mysql里也需要特殊处理。

参考资料:
《高性能MYSQL(第三版)》
mysql官方文档






在这里插入图片描述

发布了14 篇原创文章 · 获赞 170 · 访问量 8330
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章