TraceEvents&DB event(跟踪事件)总结

0、参考资料

Database Performance Tuning Guide -> Using Application Tracing Tools

Database SQL Tuning Guide -> Performing Application Tracing

Introduction to ORACLE Diagnostic EVENTS (Doc ID 218105.1)

1、event相关查询&trace信息解读

1.1、查看当前数据库设置了哪些event

查看数据库级别设置的events

show parameter event

或查询语句:

set serveroutput on
declare
event_level number;
begin
for i in 10000..30000 loop
sys.dbms_system.read_ev(i,event_level);
 if (event_level > 0) then
 dbms_output.put_line('Event '||to_char(i)||' set at level '||
     to_char(event_level));
end if;
 end loop;
end;

查询数据库设置了哪些session级别的事件:

select * from v$ses_optimizer_env where   name like '%parallel%' and ISDEFAULT='NO' and sid=27;

1.2、查看当前trc文件

建议在跟踪会话前设置tracefile_identifier,alter session set tracefile_identifier = my_session_tracefile;
然后执行dump命令,这样我们可以在udump目录下看到一个含有MY_SESSION_TRACEFILE的文件。这是最简单直观的方式找到相应的trace文件。

11g+版本 方法:

–方法1 11g:最好用

SQL> select * from v$diag_info where name='Default Trace File';

–方法2 11g:

SQL> select spid,tracefile from V$process where addr in(select paddr from v$session where sid=sys_context('userenv','sid'));

–方法3:10g/11g

SQL> oradebug setmypid 
SQL> oradebug tracefile_name 

–方法4:11g老方法

-------------a------------
SQL> select d.value
     ||'/'
     ||lower(rtrim(i.instance,chr(0)))
     ||'_ora_'
     ||p.spid
     ||'.trc' trace_file_name
     from (select p.spid
               from v$mystat m,v$session s,v$process p
      where m.statistic#=1 and s.sid=m.sid and p.addr=s.paddr) p,
      (select t.instance from v$thread t,v$parameter v
         where v.name='thread' and (v.value=0 or t.thread#=to_number(v.value))) i,
   (select value from v$parameter where name='user_dump_dest') d;
-------------b------------
SQL> select 
u_dump.value || '/' || 
db_name.value || '_ora_' || 
v$process.spid || 
nvl2(v$process.traceid, '_' || v$process.traceid, null ) 
|| '.trc' ""Trace File"" 
from 
v$parameter u_dump 
cross join v$parameter db_name 
cross join v$process 
join v$session 
on v$process.addr = v$session.paddr 
where 
u_dump.name = 'user_dump_dest' and 
db_name.name = 'db_name' and 
v$session.audsid=sys_context('userenv','sessionid'); "

10G及以前版本:

select 
  u_dump.value   || '/'     || 
  db_name.value  || '_ora_' || 
  v$process.spid || 
  nvl2(v$process.traceid,  '_' || v$process.traceid, null ) 
  || '.trc'  ""Trace File""
from 
             v$parameter u_dump 
  cross join v$parameter db_name
  cross join v$process 
        join v$session 
          on v$process.addr = v$session.paddr
where 
 u_dump.name   = 'user_dump_dest' and 
 db_name.name  = 'db_name'        and
 v$session.audsid=sys_context('userenv','sessionid');
 
C.VALUE||'/'||'ORA_'||LTRIM(TO_CHAR(A.SPID,'FM99999'))||'.TRC'
--------------------------------------------------------------------------------
/u01/oracle/app/admin/som/udump/ora_22025.trc"

1.3、SQL Trace文件格式信息解读

一些解释说明,在跟踪文件的开头部分都有说明的。

在Secrets of Oracle database一书中 第24章详细说明了SQL跟踪文件格式

Parsing in Cursor部分

len: 被分析SQL的长度
dep: 产生递归SQL的深度
uid: user id 
otc: Oracle command type 命令的类型
lid: 私有的用户id
tim: 时间戳
hv:  hash value
ad:  SQL address 

PARSE,EXEC,FETCH 部分

c:  消耗的CPU time
e:  elapsed time 操作的用时
p:  physical reads 物理读的次数
cr: consistent reads 一致性方式读取的数据块
cu: current方式读取的数据块
mis:cursor miss in cache 应分析次数
r:  -rows 处理的行数
dep:depth 递归SQL的深度
og: optimizer goal 优化器模式
tim:timstamp 时间戳

STATS部分

id:  执行计划的行源号
cnt:当前行源返回的行数
pid:当前行源号的父号
pos:执行计划中的位置
obj:当前操作对象id(如果当前行原始一个对象的话)
op: 当前行源的数据访问操作

WAIT 部分

2、会话跟踪方式

会话跟踪是最有用的跟踪方式。还有实例级别的跟踪,测试还可以,生产系统不可取。

10046相关MOS文档:

Interpreting Raw SQL_TRACE output (Doc ID 39817.1) --10046信息解读
How to Enable SQL_TRACE for Another Session or in MTS Using Oradebug (Doc ID 1058210.6)
How To Collect 10046 Trace (SQL_TRACE) Diagnostics for Performance Issues (Doc ID 376442.1) --使用10046分析问题思路

实例级别event设置:

How To Set EVENTS In The SPFILE (Doc ID 160178.1)
How to Set Multiple Events in INIT.ORA (Doc ID 1051056.6)

2.1、跟踪当前会话

方法1:设置10046 event方式跟踪sql(最常用)

alter session set tracefile_identifier='10046'; 
alter session set timed_statistics = true;
alter session set statistics_level=all;
alter session set max_dump_file_size = unlimited;
alter session set events '10046 trace name context forever,level 12';

-- Execute the queries or operations to be traced here --
select * from v$diag_info;   --11g

alter session set events '10046 trace name context off';

方法2:oradebug方式(次常用)

SQL> oradebug setmypid
Statement processed.
SQL> oradebug event 10046 trace name context forever, level 8;
Statement processed.
SQL> set serveroutput on;
SQL> declare 
  event_level number; 
  begin 
  dbms_system.read_ev(10046,event_level); 
dbms_output.put_line('event_level:'||to_char(event_level)); 
end;  
  /
event_level:8----11g读取不管设置哪一个级别,读取处理都是0

PL/SQL procedure successfully completed.

SQL> oradebug tracefile_name;
/u01/app/oracle/admin/sms/udump/sms1_ora_9339.trc
SQL> oradebug event 10046 trace name context off;
Statement processed

方法3:改会话级别参数

alter session set sql_trace=true;

方法4:dbms_support包(运行$ORACLE_HOME/rdbms/admin/dbmssupp.sql)

包含等待事件(默认级别)
exec sys.dbms_support.start_trace;
包含绑定变量,等待事件
exec sys.dbms_support.start_trace(waits=>TRUE,binds=>TRUE)
运行sql脚本或者程序追踪等待事件信息
......
关闭追踪信息
exec sys.dbms_support.stop_trace;

2.2、跟踪他人会话

方法1:oradebug方式(常用)

alter session set timed_statistics=true;
oradebug setospid 12345;
oradebug unlimit;
oradebug event 10046 trace name context forever,level 8;
在追踪会话中执行sql或程序
......
--关闭追踪
oradebug event 10046 trace name context off;
--获取追踪文件
oradebug setmypid
oradebug tracefile_name

方法2:dbms_support包方式

追踪 sid 1234 serial# 56789
exec dbms_support_start_trace_in_session(sid=>1234,serial#=>56789,waits=>true,binds=true);
在sid 1234 serial# 56789会话中执行sql或程序
......
--关闭追踪
exec dbms_support_start_trace_in_session(sid=>1234,serial#=>56789);

方法3:dbms_monitor包方式

exec dbms_monitor.session_trace_enable(session_id=>1234,serial_num=>56789,waits=>true,binds=>true);
在追踪会话中执行sql或程序
......
--关闭追踪
exec dbms_monitor.session_trace_disable(session_id=>1234,serial_num=>56789);

2.3、实例级别跟踪

参数文件中设置,不建议方式

timed_statistics=true
EVENT="10046 trace name context forever,level 8"
或
sql_trace=true

2.4、利用服务、模块动作去跟踪

exec dbms_monitor.client_id_trace_enable(client_id=>'app1');
exec dbms_monitor.client_id_trace_enable(client_id=>'app1', waits=>true, binds=>false);
exec dbms_monitor.client_id_trace_disable(client_id=>'app1');

注意:必须在dbms_application_info程序包中有应用程序使用OCI调用或者过程设置模块名和动作名
exec dbms_monitor.serv_mod_act_trace_enable(service_name=>'APPS1',module_name=>'GLEDGER',action_name=>'DEBIT_ENTRY',waits=>true,binds=>true,instance_name=>null);
在追踪会话中执行sql或程序
......
--关闭追踪
exec dbms_monitor.serv_mod_act_trace_enable(service_name=>'APPS1',module_name=>'GLEDGER',action_name=>'DEBIT_ENTRY');

3、常用的events

3.1、关闭密码延迟验证

11g有个密码错误延时验证,当应用以错误的密码连接上来时,会持续的CPU自旋等待,同时伴随library cache lock。可以设置event 28401来禁用这个特性。

alter system set event='28401 trace name context forever,level 1';
或
alter system set event='28401 trace name context forever,level 1' sid ='*' scope=spfile;

3.2、10053 跟踪sql执行计划产生过程

【使用场景】CBO 一定是选择代价最低的数据访问路径作为SQL 的执行计划。 如果觉得CBO做出的执行计划不是最优的,就应该去分析。 这时就用到了10053事件。 我们需要关注CBO选择的每一个代价最低的数据访问方式,以及提供给CBO的分析信息是否真实。

启用10053事件:

ALTER SESSION SET EVENTS='10053 trace name context forever, level 1';
或
ALTER SESSION SET EVENTS='10053 trace name context forever, level 2';
然后执行sql语句或者explain for 

关闭10053事件:

ALTER SESSION SET EVENTS '10053 trace name context off';

10053事件有两个级别:一般使用level 2

Level 2:2级是1级的一个子集,它包含以下内容:

Column statistics
ingle Access Paths
Join Costs
Table Joins Considered
Join Methods Considered (NL/MS/HA)

Level 1: 1级比2级更详细,它包含2级的所有内容,在加如下内容:

Parameters used by the optimizer
Index statistics

3.3、10231 跳过坏块

mos参考资料:

Extracting Data from a Corrupt Table using DBMS_REPAIR or Event 10231 (Doc ID 33405.1)

–启用10231内部事件

alter system set events='10231 trace name context forever,level 10';

开启10231事件后,查询表的时候就不会报ORA-01578错误。然后就可以把表重建或者导出。
–关闭10231内部事件

alter system set events='10231 trace name context off';

4、Trace Listener

如果是监听没有密码的情况下:

1.在listener.ora文件中加入参数TRACE_LEVEL_LISTENER=16,或者在命令行输入lsnrctl trace 16(默认监听) 或 lsnrctl trace listener_name 16

[oracle@db ~]$lsnrctl trace listener_name 16

注:TRACE_LEVEL_LISTENER的取值范围为0~16,当然级别越高,收集的信息就相对越全面,系统默认是0,即不生成trace信息。

2.此时,客户端通过listener连接到服务器的关于监听相关的信息都会记录到trace文件中,trace文件默认是存放在$ORACLE_HOME/network/trace目录下。

3.关闭Listener Trace。可通过将listener.ora文件中的TRACE_LEVEL_LISTENER设置为0,或者直接在命令行执行lsnrctl trace OFF

[oracle@db ~]$lsnrctl trace OFF

4.进入ORACLEHOME/network/tracetrace[oracle@dbtrace]ORACLE_HOME/network/trace目录,格式化trace文件,如: [oracle@db trace]trcasst listener.trc > abc.log

下面是官方文档的监听跟踪的一种方法:

Listener and sqlnet trace
Posted by decipherinfosys on June 5, 2007
At times, when troubleshooting connectivity issues or performance issues, you might need to run listener trace (server side) and/or a sqlnet trace (client side trace).  Oracle support staff will also ask for these files when you enlist their help in troubleshooting these issues.  Here are the steps on how you can do that:
To enable sqlnet trace (client side trace):
Add the following to the sqlnet.ora file on the application server(s) from where the connections are being made to the Oracle database:
Trace_level_client=16
Trace_directory_client=<path_to_the_trace_directory> # use the full path to the trace directory
Trace_unique_client=on
Trace_timestamp_client=on
To enable listener trace (server side):
Add the following to the listener.ora file on the db server before starting the listener:
TRACE_TIMESTAMP_<listener_name>=on
TRACE_DIRECTORY_< listener_name>=<path_to_the_trace_directory>
Here <listener_name> is the name of the listener. Then run lsnrctl to turn on the listener trace:
lsnrctl> set current_listener <listener_name>
lsnrctl> set trc_level support
You can run both trace at the same time for 15 minutes or so in order to get some meaningful data set.
To stop the sqlnet trace:
Remove the following entries from sqlnet.ora or comment them out by using the # sign:
Trace_level_client=16
Trace_directory_client=<path_to_the_trace_directory> # use the full path to the trace directory
Trace_unique_client=on
Trace_timestamp_client=on
To stop the listener trace:
lsnrctl> set trc_level off
For getting more information on the trace levels and the different parameters for these traces, please refer metalink or otn.

4、Trace Data Pump

MOS文档参考:

Export/Import DataPump Parameter TRACE - How to Diagnose Oracle Data Pump (文档 ID 286496.1)
How To Use The New 11g Events++ Syntax For Easier SQL Tracing Of Datapump Operations? [ID 813737.1]

To enable 10046 level 12 tracing for e.g. the Datapump Master (DM) and Worker (DW) processes the following event can be set:

alter system set events 'sql_trace {process : pname = dw | pname = dm} level=12';

Disabling of the tracing can be done in a similar fashion:

alter system set events 'sql_trace {process : pname = dw | pname = dm} off';
The new event syntax can also be used to enable an event for a specific process, like in:

alter system set events 'sql_trace {process : ospid = 2345} level=12';

Note: the Event++ syntax is only available in Oracle11g and higher releases. It does not work in lower releases of Oracle.

以下补充内容来自互联网:

补充1:Oracle跟踪文件说明

Oracle跟踪文件分为三种类型,一种是后台报警日志文件,记录数据库在启动、关闭和运行期间后台进程的活动情况,如表空间创建、回滚段创建、某些alter命令、日志切换、错误消息等。在数据库出现故障时,应首先查看该文件,但文件中的信息与任何错误状态没有必然的联系。后台报警日志文件保存BACKGROUND_DUMP_DEST参数指定的目录中,文件格式为SIDALRT.LOG。另一种类型是DBWR、LGWR、SMON等后台进程创建的后台跟踪文件。后台跟踪文件根据后台进程运行情况产生,后台跟踪文件也保存在BACKGROUND_DUMP_DEST参数指定的目录中,文件格式为siddbwr.trc、sidsmon.trc等。还有一种类型是由连接到Oracle的用户进程(Server Processes)生成的用户跟踪文件。这些文件仅在用户会话期间遇到错误时产生。此外,用户可以通过执行oracle跟踪事件(见后面)来生成该类文件,用户跟踪文件保存在USER_DUMP_DEST参数指定的目录中,文件格式为oraxxxxx.trc,xxxxx为创建文件的进程号(或线程号)。

补充2:Oracle跟踪事件说明

Oracle提供了一类命令,可以将Oracle各类内部结构中所包含的信息转储(dump)到跟踪文件中,以便用户能根据文件内容来解决各种故障。设置跟踪事件有两种方法,一种是在init.ora文件中设置事件,这样open数据库后,将影响到所有的会话。设置格式如下:

EVENT=“eventnumber trace name eventname [forever,] [level levelnumber] : …”

通过:符号,可以连续设置多个事件,也可以通过连续使用event来设置多个事件。

另一种方法是在会话过程中使用alter session set events命令,只对当前会话有影响。设置格式如下:

alter session set events ‘[eventnumber|immediate] trace name eventname [forever] [, level levelnumber] : …’

通过:符号,可以连续设置多个事件,也可以通过连续使用alter session set events 来设置多个事件。

格式说明:eventnumber指触发dump的事件号,事件号可以是Oracle错误号(出现相应错误时跟踪指定的事件)或oralce内部事件号,内部事件号在10000到10999之间,不能与immediate关键字同用。

immediate关键字表示命令发出后,立即将指定的结构dump到跟踪文件中,这个关键字只用在alter session语句中,并且不能与 eventnumber、forever关键字同用。

trace name 是关键字。

eventname指事件名称(见后面),即要进行dump的实际结构名。若eventname为context,则指根据内部事件号进行跟踪。

forever关键字表示事件在实例或会话的周期内保持有效状态,不能与immediate同用。

level为事件级别关键字。但在dump错误栈(errorstack)时不存在级别。

levelnumber表示事件级别号,一般从1到10,1表示只dump结构头部信息,10表示dump结构的所有信息。

补充3:跟踪事件概述

1、buffers事件:dump SGA缓冲区中的db buffer结构

alter session set events ‘immediate trace name buffers level 1’; --表示dump缓冲区的头部。

2、blockdump事件:dump数据文件、索引文件、回滚段文件结构

alter session set events ‘immediate trace name blockdump level 66666’; --表示dump块地址为6666的数据块。

在Oracle 8以后该命令已改为:

alter system dump datafile 11 block 9; --表示dump数据文件号为11中的第9个数据块。

3、controlf事件:dump控制文件结构

alter session set events ‘immediate trace name controlf level 10’; --表示dump控制文件的所有内容。

4、locks事件:dump LCK进程的锁信息

alter session set events ‘immediate trace name locks level 5’;

5、redohdr事件:dump redo日志的头部信息

alter session set events 'immediate trace name redohdr level 1'; --表示dump redo日志头部的控制文件项。 
alter session set events 'immediate trace name redohdr level 2'; --表示dump redo日志的通用文件头。 
alter session set events 'immediate trace name redohdr level 10'; --表示dump redo日志的完整文件头。

注意:redo日志的内容dump可以采用下面的语句:

alter system dump logfile ‘logfilename’;

6、loghist事件:dump控制文件中的日志历史项

alter session set events 'immediate trace name loghist level 1'; --表示只dump最早和最迟的日志历史项。 
levelnumber大于等于2时,表示2的levelnumber次方个日志历史项。 
alter session set events 'immediate trace name loghist level 4'; --表示dump 16个日志历史项。

7、file_hdrs事件:dump 所有数据文件的头部信息

alter session set events 'immediate trace name file_hdrs level 1'; --表示dump 所有数据文件头部的控制文件项。 
alter session set events 'immediate trace name file_hdrs level 2'; --表示dump 所有数据文件的通用文件头。 
alter session set events 'immediate trace name file_hdrs level 10'; --表示dump 所有数据文件的完整文件头。 

8、errorstack事件:dump 错误栈信息,通常Oracle发生错误时前台进程将得到一条错误信息,但某些情况下得不到错误信息,可以采用这种方式得到Oracle错误。

alter session set events ‘604 trace name errorstack forever’; --表示当出现604错误时,dump 错误栈和进程栈。

9、systemstate事件:dump所有系统状态和进程状态

alter session set events ‘immediate trace name systemstate level 10’; --表示dump 所有系统状态和进程状态。

10、coalesec事件:dump指定表空间中的自由区间

levelnumber以十六进制表示时,两个高位字节表示自由区间数目,两个低位字节表示表空间号,如0x00050000表示dump系统表空间中的5个自由区间,转换成十进制就是327680,即:

alter session set events ‘immediate trace name coalesec level 327680’;

11、processsate事件:dump进程状态

alter session set events ‘immediate trace name processsate level 10’;

12、library_cache事件:dump library cache信息

alter session set events ‘immediate trace name library_cache level 10’;

13、heapdump事件:dump PGA、SGA、UGA中的信息

alter session set events ‘immediate trace name heapdump level 1’;

14、row_cache事件:dump数据字典缓冲区中的信息

alter session set events ‘immediate trace name row_cache level 1’;

补充4:内部事件号概述;可能有出入,以官方说明和实际为准

1、10013:用于监视事务恢复

2、10015:转储UNDO SEGMENT头部

event = “10015 trace name context forever”

3、10029:用于给出会话期间的登陆信息

4、10030:用于给出会话期间的注销信息

5、10032:转储排序的统计信息

6、10033:转储排序增长的统计信息

7、10045:跟踪Freelist管理操作

8、10046:跟踪SQL语句

alter session set events '10046 trace name context forever, level 4'; --跟踪SQL语句并显示绑定变量 
alter session set events '10046 trace name context forever, level 8'; --跟踪SQL语句并显示等待事件 

9、10053:转储优化策略

10、10059:模拟redo日志中的创建和清除错误

11、10061:阻止SMON进程在启动时清除临时段

12、10079:转储 SQL*NET统计信息

13、10081:转储高水标记变化

14、10104:转储Hash连接统计信息

15、10128:转储分区休整信息

16、10200:转储一致性读信息

17、10201:转储一致性读中Undo应用

18、10209:允许在控制文件中模拟错误

19、10210:触发数据块检查事件

event = “10210 trace name context forever, level 10”

20、10211:触发索引检查事件

21、10213:模拟在写控制文件后崩溃

22、10214:模拟在控制文件中的写错误

levelnumber从1-9表示产生错误的块号,大于等于10则每个控制文件将出错

23、10215:模拟在控制文件中的读错误

24、10220:转储Undo头部变化

25、10221;转储Undo变化

26、10224:转储索引的分隔与删除

27、10225:转储基于字典管理的区间的变化

28、10229:模拟在数据文件上的I/O错误

29、10231:设置在全表扫描时忽略损坏的数据块

alter session set events '10231 trace name context off'; -- 关闭会话期间的数据块检查 
event = "10231 trace name context forever, level 10" -- 对任何进程读入SGA的数据块进行检查 

30、10232:将设置为软损坏(DBMS_REPAIR包设置或DB_BLOCK_CHECKING为TRUE时设置)的数据块dump到跟踪文件

31、10235:用于内存堆检查

alter session set events ‘10235 trace name context forever, level 1’;

32、10241:转储远程SQL执行

33、10246:跟踪PMON进程

34、10248:跟踪dispatch进程

35、10249:跟踪MTS进程

36、10252:模拟写数据文件头部错误

37、10253:模拟写redo日志文件错误

38、10262:允许连接时存在内存泄漏

alter session set events ‘10262 trace name context forever, level 300’; – 允许存在300个字节的内存泄漏

39、10270:转储共享游标

40、10285:模拟控制文件头部损坏

41、10286:模拟控制文件打开错误

42、10287:模拟归档出错

43、10357:调试直接路径机制

44、10500:跟踪SMON进程

45、10608:跟踪位图索引的创建

46、10704:跟踪enqueues

47、10706:跟踪全局enqueues

48、10708:跟踪RAC的buffer cache

49、10710:跟踪对位图索引的访问

50、10711:跟踪位图索引合并操作

51、10712:跟踪位图索引OR操作

52、10713:跟踪位图索引AND操作

53、10714:跟踪位图索引MINUS操作

54、10715:跟踪位图索引向ROWID的转化

55、10716:跟踪位图索引的压缩与解压

56、10719:跟踪位图索引的修改

57、10731:跟踪游标声明

58、10928:跟踪PL/SQL执行

59、10938:转储PL/SQL执行统计信息

最后要说明的是,由于版本不同以上语法可能有些变化,但大多数还是可用的。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章