数据块结构
Oracle 数据块有三部分:
Cache layer
Transaction layer
Data layer
Oracle Data Block的结构简图如下,其中从Data header到Row Data部分合称Data Layer:
———————
– Cache Layer –
———————
– Transaction Layer –
———————
– Data Header –
———————
– Table Directory –
———————
– Row Directory –
———————
– Free Space –
———————
– Row Data –
———————
– Tailchk –
———————
下面将使用bbed工具来显示相关结构信息
BBED> map File: /u01/app/oracle/oradata/shardcat/users01.dbf (7) Block: 135 Dba:0x01c00087 ------------------------------------------------------------ KTB Data Block (Table/Cluster) struct kcbh, 20 bytes @0 struct ktbbh, 72 bytes @20 struct kdbh, 14 bytes @100 struct kdbt[1], 4 bytes @114 sb2 kdbr[8] @118 ub1 freespace[7983] @134 ub1 rowdata[71] @8117 ub4 tailchk @8188
数据块组件
Oracle数据块三层C结构,它被映射到SGA kcbh(内核缓存数据块头)中的数据块。Cache Layer包含关于块格式,类型(数据,索引,头等)信息和序列数据。
BBED> p kcbh struct kcbh, 20 bytes @0 ub1 type_kcbh @0 0x06 ub1 frmt_kcbh @1 0xa2 ub2 wrp2_kcbh @2 0x0000 ub4 rdba_kcbh @4 0x01c00087 ub4 bas_kcbh @8 0x01286184 ub2 wrp_kcbh @12 0x0000 ub1 seq_kcbh @14 0x01 ub1 flg_kcbh @15 0x06 (KCBHFDLC, KCBHFCKV) ub2 chkval_kcbh @16 0x0137 ub2 spare3_kcbh @18 0x0000
Cache Layer:Block的第一部分,长度为20字节,内部数据结构名为kcbh,包括
type_kcbh:块类型(table/index,rollback segment,temporary segment等)
frmt_kcbh:块格式(v6,v7,v8)
rdba_kcbh:块地址DBA
bas_kcbh/wrp_kcbh:SCN
seq_kcbh:块的序列号
flg_kcbh:块的标志
事务层存储了关于数据块的事务信息
Transaction Layer:内部结构名ktbbh。分成两部分,第一部分为固定长度,长度为24字节,包含事务相关的一些基本信息。第二部分为可变长度,包含itl,长度根据itl条目的个数变化,每个itl长度为24字节,内部结构名ktbbhitl
BBED> p ktbbh struct ktbbh, 72 bytes @20 ub1 ktbbhtyp @20 0x01 (KDDBTDATA) union ktbbhsid, 4 bytes @24 ub4 ktbbhsg1 @24 0x0001af27 ub4 ktbbhod1 @24 0x0001af27 struct ktbbhcsc, 8 bytes @28 ub4 kscnbas @28 0x01286182 ub2 kscnwrp @32 0x8000 ub2 kscnwrp2 @34 0x0000 sb2 ktbbhict @36 7938 ub1 ktbbhflg @38 0x32 (NONE) ub1 ktbbhfsl @39 0x00 ub4 ktbbhfnx @40 0x01c00080 struct ktbbhitl[0], 24 bytes @44 struct ktbitxid, 8 bytes @44 ub2 kxidusn @44 0x0006 ub2 kxidslt @46 0x0012 ub4 kxidsqn @48 0x000038f6 struct ktbituba, 8 bytes @52 ub4 kubadba @52 0x010002d9 ub2 kubaseq @56 0x10c9 ub1 kubarec @58 0x09 ub2 ktbitflg @60 0x8000 (KTBFCOM) union _ktbitun, 2 bytes @62 sb2 _ktbitfsc @62 -32768 ub2 _ktbitwrp @62 0x8000 ub4 ktbitbas @64 0x01228dbb struct ktbbhitl[1], 24 bytes @68 struct ktbitxid, 8 bytes @68 ub2 kxidusn @68 0x0008 ub2 kxidslt @70 0x001b ub4 kxidsqn @72 0x00003a9a struct ktbituba, 8 bytes @76 ub4 kubadba @76 0x010002b5 ub2 kubaseq @80 0x114f ub1 kubarec @82 0x20 ub2 ktbitflg @84 0x2001 (KTBFUPB) union _ktbitun, 2 bytes @86 sb2 _ktbitfsc @86 10 ub2 _ktbitwrp @86 0x000a ub4 ktbitbas @88 0x01286184
这种结构出现在数据库每个数据块的开头部分。它甚至出现在不由redo改变的排序块中。它也会出现在数据文件头块和控制文件头块的开头部分。缓存层提供了对坏数据的规模。它也用来确保正确的数据块被读取并且数据块没有破裂或损坏。所谓破裂的数据块就是只有一部分被写入磁盘,数据块的一部分保留了之前的版本。
Data Layer:包括Data Header,Table Directory,Row Directory,Free Space和Row Data。
Data Header:长度14字节,内部数据结构名kdbh
BBED> p kdbh struct kdbh, 14 bytes @100 ub1 kdbhflag @100 0x00 (NONE) sb1 kdbhntab @101 1 sb2 kdbhnrow @102 8 sb2 kdbhfrre @104 -1 sb2 kdbhfsbo @106 34 sb2 kdbhfseo @108 8017 sb2 kdbhavsp @110 7977 sb2 kdbhtosp @112 7989
其中kdbhnrow是存储在数据块中的记录数为8,而表中确实有8条记录。(从ROWID可以判断出来)
SQL> select dbms_rowid.rowid_block_number(rowid),t1.t_id,t1.t_name from jy.t1; DBMS_ROWID.ROWID_BLOCK_NUMBER(ROWID) T_ID T_NAME ------------------------------------ ---------- ---------------------------------------- 134 9 YYL 135 1 A 135 2 B 135 3 C 135 4 D 135 5 E 135 6 F 135 7 JYHY 135 8 JYYYL 9 rows selected.
Table Directory: 一般table只有一个条目,cluster则有一个或多个条目。每个条目长4字节,内部数据结构名kdbt
BBED> p kdbt struct kdbt[0], 4 bytes @114 sb2 kdbtoffs @114 0 sb2 kdbtnrow @116 8
Row Directory:数目由块中数据的行数决定,每个条目长2字节,内部数据结构名kdbr
BBED> p kdbr sb2 kdbr[0] @118 8080 sb2 kdbr[1] @120 8072 sb2 kdbr[2] @122 8064 sb2 kdbr[3] @124 8056 sb2 kdbr[4] @126 8048 sb2 kdbr[5] @128 8040 sb2 kdbr[6] @130 8029 sb2 kdbr[7] @132 8017
查看表中的记录数据,一个重复计数也可以被指定用来重复执行examine命令来检查后续的行记录。下面的例子显示了先使用print命令来设置最后一行记录的偏移量,然后检查后面的8行记录的操作.
BBED> p *kdbr[7] rowdata[0] ---------- ub1 rowdata[0] @8117 0x2c BBED> x /8rnc rowdata[0] @8117 ---------- flag@8117: 0x2c (KDRHFL, KDRHFF, KDRHFH) lock@8118: 0x02 cols@8119: 2 col 0[2] @8120: 8 col 1[5] @8123: JYYYL rowdata[12] @8129 ----------- flag@8129: 0x2c (KDRHFL, KDRHFF, KDRHFH) lock@8130: 0x00 cols@8131: 2 col 0[2] @8132: 7 col 1[4] @8135: JYHY rowdata[23] @8140 ----------- flag@8140: 0x2c (KDRHFL, KDRHFF, KDRHFH) lock@8141: 0x00 cols@8142: 2 col 0[2] @8143: 6 col 1[1] @8146: F rowdata[31] @8148 ----------- flag@8148: 0x2c (KDRHFL, KDRHFF, KDRHFH) lock@8149: 0x00 cols@8150: 2 col 0[2] @8151: 5 col 1[1] @8154: E rowdata[39] @8156 ----------- flag@8156: 0x2c (KDRHFL, KDRHFF, KDRHFH) lock@8157: 0x00 cols@8158: 2 col 0[2] @8159: 4 col 1[1] @8162: D rowdata[47] @8164 ----------- flag@8164: 0x2c (KDRHFL, KDRHFF, KDRHFH) lock@8165: 0x00 cols@8166: 2 col 0[2] @8167: 3 col 1[1] @8170: C rowdata[55] @8172 ----------- flag@8172: 0x2c (KDRHFL, KDRHFF, KDRHFH) lock@8173: 0x00 cols@8174: 2 col 0[2] @8175: 2 col 1[1] @8178: B rowdata[63] @8180 ----------- flag@8180: 0x2c (KDRHFL, KDRHFF, KDRHFH) lock@8181: 0x00 cols@8182: 2 col 0[2] @8183: 1 col 1[1] @8186: A
Free Space:表示数据块中可用空间,内部数据结构名freespace
Row Data:表示实际的数据,内部数据结构名rowdata
BBED> p rowdata[0] ub1 rowdata[0] @8117 0x2c BBED> d /v offset 8117 File: /u01/app/oracle/oradata/shardcat/users01.dbf (7) Block: 135 Offsets: 8117 to 8191 Dba:0x01c00087 ------------------------------------------------------- 2c020202 c109054a 5959594c 2c000202 l ,......JYYYL,... c108044a 5948592c 000202c1 0701462c l ...JYHY,......F, 000202c1 0601452c 000202c1 0501442c l ......E,......D, 000202c1 0401432c 000202c1 0301422c l ......C,......B, 000202c1 02014101 068461 l ......A...a <16 bytes per line>
Tailchk:保存在块结尾用于校验的数据,长度4个字节,内部结构名tailchk。所有Oracle块的最后四个字节都是tail check(结尾检查)。
对于一个Oracle 8以上版本的数据块的tail它是由SCN base的低位两字节的内容,数据块的类型与SCN序列号组成的。例如,如果SCN base为 0x01286184,数据块类型为0x06,SCN序列号为0x01,那么tail check将是0x61840601
BBED> p tailchk ub4 tailchk @8188 0x61840601 BBED> p kcbh struct kcbh, 20 bytes @0 ub1 type_kcbh @0 0x06 ub1 frmt_kcbh @1 0xa2 ub2 wrp2_kcbh @2 0x0000 ub4 rdba_kcbh @4 0x01c00087 ub4 bas_kcbh @8 0x01286184 ub2 wrp_kcbh @12 0x0000 ub1 seq_kcbh @14 0x01 ub1 flg_kcbh @15 0x06 (KCBHFDLC, KCBHFCKV) ub2 chkval_kcbh @16 0x0137 ub2 spare3_kcbh @18 0x0000
虽然tail check的值通常是由这三个组件级成,Oracle会对最终的值作为一个值(4字节)以单无符号整数来存储。在小字节序编码(little-endian)的构架机器中,比如Intel,这个值将以低位字节优先的方式来存储。因此如果使用标准块编辑器或dump命令来检查数据块的tail check时,字节顺序可能不一样。一个tail check为0x61840601,在Intel机器上它将以”01068461″的形式存储在磁盘。
BBED> dump /v offset 8188 File: /u01/app/oracle/oradata/shardcat/users01.dbf (7) Block: 135 Offsets: 8188 to 8191 Dba:0x01c00087 ------------------------------------------------------- 01068461 l ...a <16 bytes per line>