Oracle中rowid的用法（全面）

ROWID是數據的詳細地址，通過rowid，Oracle可以快速的定位某行具體的數據的位置。

ROWID可以分爲物理rowid和邏輯rowid兩種。普通的堆表中的rowid是物理rowid，索引組織表(IOT)的rowid是邏輯rowid。oracle提供了一種urowid的數據類型，同時支持物理和邏輯rowid。本文主要關注物理rowid

物理rowid又分爲擴展rowid(extended rowid)和限制rowid(restricted rowid)兩種格式。限制rowid主要是oracle7以前的rowid格式，現在已經不再使用，保留該類型只是爲了兼容性。所以本文的提到物理rowid一般是指擴展rowid格式。

本文主要內容：

1.Rowid的顯示形式

2.如何從rowid計算得到obj#,rfile#,block#,row#

3.如何從obj#,rfile#,block#,row#計算得到rowid

4.Rowid的內部存儲格式

5.Index中存儲的rowid

1.Rowid的顯示形式

我們從rowid僞列裏select出來的rowid是基於base64編碼，一共有18位，分爲4部分：

OOOOOOFFFBBBBBBRRR

其中：

OOOOOO：六位表示data object id，根據object id可以確定segment。關於data object id和object id的區別，請參考http://www.orawh.com/index.php/archives/62

FFF：三位表示相對文件號。根據該相對文件號可以得到絕對文件號，從而確定datafile。關於相對文件號和絕對文件號，請參考http://blog.itpub.net/post/330/22749

BBBBBB：六位表示data block number。這裏的data block number是相對於datafile的編號，而不是相對於tablespace的編號。

RRR：三位表示row number。

Oracle提供了dbm_rowid來進行rowid的一些轉換計算。

SQL> create table test(id int,name varchar2(30));

Table created.

SQL> insert into test values(1,'a');

1 row created.

SQL> commit;

Commit complete.

SQL> select rowid from test;

ROWID
------------------
AAAGbEAAHAAAAB8AAA

SQL> select dbms_rowid.rowid_object(rowid) obj#,
2 dbms_rowid.rowid_relative_fno(rowid) rfile#,
3 dbms_rowid.rowid_block_number(rowid) block#,
4 dbms_rowid.rowid_row_number(rowid) row#,
5 dbms_rowid.rowid_to_absolute_fno(rowid,'SYS','TEST') file#
6 from test;

OBJ# RFILE# BLOCK# ROW# FILE#
----------- ------------ ------------- ---------- ----------
26308 7 124 0 7

2. 如何從rowid計算得到obj#,rfile#,block#,row#

rowid是base64編碼的，用A~Z a~z 0~9 + /共64個字符表示。A表示0，B表示1，……，a表示26，……，0表示52，……，+表示62，/表示63可以將其看做一個64進制的數。

所以，

obj#=AAAGbE=6*64^2+27*64+4=26308

rfile#=AAH=7

block#=AAAAB8=64+60=124

row#=AAA=0

3. 如何從obj#,rfile#,block#,row#計算得到rowid

實際上就是將十進制數轉化成64進制數，當然，從二進制轉化的規則比較簡單點。

將二進制數從右到左，6個bit一組，然後將這6個bit組轉成10進制數，就是A~Z a~z 0~9 + /這64個字符的位置（從0開始），替換成base64的字符即可。

obj#=26308=110 011011 000100=6 27 4=G b E，補足成6位base64編碼，左邊填0，也就是A，結果爲AAAGbE

rfile#=7=111=7=H，補足成3位，得到AAH

block#=124=1 111100=1 60=B 8，補足成6位，得到AAAAB8

row#=0，3位AAA

合起來就是AAAGbEAAHAAAAB8AAA

4. Rowid的內部存儲格式

雖然我們從rowid僞列中select出來的rowid是以base64字符顯示的，但在oracie內部存儲的時候還是以原值的二進制表示的。一個擴展rowid採用10個byte來存儲，共80bit，其中obj#32bit,rfile#10bit,block#22bit,row#16bit。所以相對文件號不能超過1023，也就是一個表空間的數據文件不能超過1023個（不存在文件號爲0的文件），一個datafile只能有2^22=4M個block,，一個block中不能超過2^16＝64K行數據。而一個數據庫內不能有超過2^32=4G個object。

SQL> select dump(rowid,16) from test;

DUMP(ROWID,16)
--------------------------------------------

Typ=69 Len=10: 0,0,66,c4,1,c0,0,7c,0,0

00000000 00000000 01100110 11000100 00000001 11000000 00000000 01111100 00000000 00000000

最右邊16bit爲row#=00000000 00000000=0

接下來22bit爲block#=000000 00000000 01111100=124

接下來10bit爲rfile#=00000001 11=7

接下來32bit爲obj#=00000000 00000000 01100110 11000100=26308

5. Index中存儲的rowid

a. 普通B-tree索引

SQL> create index ix_test on test(id);

Index created.

SQL> select file_id,block_id from dba_extents where segment_name='IX_TEST' and owner=user;

FILE_ID BLOCK_ID
---------- ----------
7 129

---由於是assm表空間，去掉3個block的頭
SQL> alter system dump datafile 1 block 132;

System altered.

得到trace文件內容如下（省略無關內容）：
row#0[8024] flag: -----, lock: 0
col 0; len 2; (2): c1 02 ---索引鍵數據ID=1
col 1; len 6; (6): 01 c0 00 7c 00 00 ---對應的rowid記錄
----- end of leaf block dump -----
End dump data blocks tsn: 7 file#: 7 minblk 132 maxblk 132

普通索引中保存的rowid是不包括obj#的，但是分區表的global index是包括obj#的，這是因爲分區表包括多個segment，每個segment可能在不同的datafile中，根據表的obj#就無法確定該索引鍵對應的rowid（rfile#確定不了）。

01 c0 00 7c 00 00 轉化爲二進制 000000001 11000000 00000000 01111100 00000000 00000000

右邊8bit row#=0

接下來22bit block#=000000 00000000 01111100=124

接下來10bit rfile#=000000001 11=7

b.唯一索引

SQL> drop index ix_test;

Index dropped.

SQL> create unique index ix_test on test(id);

Index created.

SQL> select file_id,block_id from dba_extents where segment_name='IX_TEST' and owner=user;

FILE_ID BLOCK_ID
---------- ----------
7 129

SQL> alter system dump datafile 1 block 132;

System altered.

得到trace文件內容如下：

row#0[8025] flag: -----, lock: 0, data:(6): 01 c0 00 7c 00 00 ---對應的rowid記錄
col 0; len 2; (2): c1 02 ---索引鍵數據ID=1
----- end of leaf block dump -----
End dump data blocks tsn: 7 file#: 7 minblk 132 maxblk 132

得到rowid爲 01 c0 00 7c 00 00，具體的轉換計算和前面的一樣，就不重複了。

Base64編碼說明
　　Base64編碼要求把3個8位字節（3*8=24）轉化爲4個6位的字節（4*6=24），之後在6位的前面補兩個0，形成8位一個字節的形式。如果剩下的字符不足3個字節，則用0填充，輸出字符使用'='，因此編碼後輸出的文本末尾可能會出現1或2個'='。

　　爲了保證所輸出的編碼位可讀字符，Base64制定了一個編碼表，以便進行統一轉換。編碼表的大小爲2^6=64，這也是Base64名稱的由來。

Base64編碼表

碼值	字符	碼值	字符	碼值	字符	碼值	字符
0	A	16	Q	32	g	48	w
1	B	17	R	33	h	49	x
2	C	18	S	34	i	50	y
3	D	19	T	35	j	51	z
4	E	20	U	36	k	52	0
5	F	21	V	37	l	53	1
6	G	22	W	38	m	54	2
7	H	23	X	39	n	55	3
8	I	24	Y	40	o	56	4
9	J	25	Z	41	p	57	5
10	K	26	a	42	q	58	6
11	L	27	b	43	r	59	7
12	M	28	c	44	s	60	8
13	N	29	d	45	t	61	9
14	O	30	e	46	u	62	+
15	P	31	f	47	v	63	/

原文鏈接：http://hi.baidu.com/wwynhm/item/1a376fbc6063b7d084dd79a7
關於《關於base64編碼的原理及實現》

Oracle中rowid的用法（全面）

Base64編碼表

python gdal 安裝使用（Windows， python 3.6.8）

RMAN備份詳解

Oracle中rowid的用法（全面）

TreeSet集合介紹

Java中遍歷MAP的幾種方法

集合框架

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結