用dump函數來了解oracle的數據類型存儲方式

問題:
1. oracle中number,char/varchar,date等數據類型是怎麼存儲的?字節流是什麼樣的?
2. 各種數據類型佔用的字節長度是多大?

SELECT dump(1), DUMP(123456), DUMP(-123456), DUMP(1234567890123456) -- 整數
--SELECT DUMP(123456.789), DUMP(-123456.789), dump(1.234567890123456789E15), dump(123456789012345678901234567890123456789) -- 浮點數
SELECT DUMP('a'), DUMP('abcdefghijklmn'), DUMP(CAST('abc' AS CHAR(20))), DUMP(CAST('abc你' AS VARCHAR(20)))
--SELECT sysdate, DUMP(SYSDATE)
FROM dual;

結論:
1. number類型的字節流是不定長的,並且正負數會用不同的標誌位(正數:數字1 >= 193,負數:數字1 <= 62,差額恰好是指數大小)
2. char是定長的,長度不足最大長度會填充尾空格,varchar是不定長的(即給多長存多長)
3. date類型定長,佔8個字節

-- 附錄爲常見數據類型的存儲方式說明,可參見oracle官方文檔,或各種技術blog
http://blog.oracle.com.cn/index.php/12012/action_viewspace_itemid_4684.html(附錄的來源)
http://zhouwf0726.itpub.net/post/9689/196733

筆者在做實驗過程(oracle9i2版本)中,發現實際Date類型與附錄中的不一樣,估計附錄中是對oracle8以前版本的說明。

Date(長度 7 類型 12)

col dump_date form a35col real_date form a35
select dump(last_ddl_time) dump_date, to_char(last_ddl_time,'yyyy-mm-dd hh24:mi:ss') real_date
from user_objects
where rownum=1;

DUMP_DATE                           REAL_DATE
----------------------------------- ---------------------
Typ=12 Len=7: 120,102,4,13,16,48,53 2002-04-13 15:47:52世紀 120 - 100 = 20 世紀和年份加100後存儲
年份 102 - 100 = 2
月份 4 月份和日期按原值存儲
日期 13
小時 16 - 1 = 15 時間均加1後存儲
分鐘 48 - 1 = 47
秒 53 - 1 = 52
--------------------------------------------------------------------------------

Number(類型 2)

<[長度]>,符號位/指數 數字1,數字2,數字3,......,數字20

正數:指數=數字1 - 193 (最高位爲1是代表正數)
負數:指數=62 - 第一字節

數字1是最高有效位

正數:加1存儲
負數:被101減,如果總長度小於21個字節,最後加一個102(是爲了排序的需要)

所存儲的數值計算方法爲:

把下面計算的結果加起來:

每個數字乘以100^(指數-N) (N是有效位數的順序位,第一個有效位的N=0)

例:

select dump(123456.789) from dual;

DUMP(123456.789)
-------------------------------
Typ=2 Len=6: 195,13,35,57,79,91   指數 195 - 193 = 2
數字1 13 - 1 = 12 *1002-0 120000
數字2 35 - 1 = 34 *1002-1 3400
數字3 57 - 1 = 56 *1002-2 56
數字4 79 - 1 = 78 *1002-3 .78
數字5 91 - 1 = 90 *1002-4 .009
  123456.789

select dump(-123456.789) from dual;

DUMP(-123456.789)
----------------------------------
Typ=2 Len=7: 60,89,67,45,23,11,102指數 62 - 60 = 2(最高位是0,代表爲負數)
數字1 101 - 89 = 12 *1002-0 120000
數字2 101 - 67 = 34 *1002-1 3400
數字3 101 - 45 = 56 *1002-2 56
數字4 101 - 23 = 78 *1002-3 .78
數字5 101 - 11 = 90 *1002-4 .009
  123456.789(-)

現在再考慮一下爲什麼在最後加102是爲了排序的需要,-123456.789在數據庫中實際存儲爲60,89,67,45,23,11
而-123456.78901在數據庫中實際存儲爲60,89,67,45,23,11,91
可見,如果不在最後加上102,在排序時會出現-123456.789<-123456.78901的情況

 

發佈了77 篇原創文章 · 獲贊 11 · 訪問量 25萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章