Oracle SQL調優系列之定位生產性能問題方法
1、AWR整體分析
場景:最近遇到緊急生產問題,因爲數據庫鎖表導致業務功能不能正常使用,對於這種緊急問題,首先要安穩心態,然後合理分析問題,可以先從整體出發,拿下Oracle AWR報告,進行整體分析,需要找出是因爲cpu問題,還是具體哪裏的程序導致的
2、JVM命令進行監控
從整體不能定位到問題,還是需要配合JVM的調優命令進行排查問題,監控是否出現oom的情況?
// 監控進程信息
[www@localhost ~]$ top
// 查找具體的線程情況
[www@localhost ~]$ top -H -p PID
// 查看進程id
[www@localhost ~]$ jps -l
//根據jps拿到的PID獲取堆信息,然後使用gcviewer等等工具進行分析
[www@localhost ~]$ jmap -dump:format=b,file=heap.hprof PID
// 直接查看程序堆信息
[www@localhost ~]$ jmap -heap PID
// 查看棧信息,看看是否有程序死鎖的情況
[www@localhost ~]$ jstack PID
gc監控工具:MAT、gcviewer,也可以通過在線網站進行分析https://gceasy.io/
3、拿到鎖表sql
ok,程序排查沒問題,從sql方面進行排查
- 查看是否有鎖表
SELECT object_name, machine, s.sid, s.serial#
FROM gv$locked_object l, dba_objects o, gv$session s
WHERE l.object_id = o.object_id
AND l.session_id = s.sid;
- 釋放數據表鎖
// 釋放SESSION SQL:
alter system kill session 'sid, serial#';
ALTER system kill session '23, 1647';
- 查看具體的鎖表sql
select l.session_id sid,
s.serial#,
l.locked_mode,
l.oracle_username,
s.user#,
l.os_user_name,
s.machine,
s.terminal,
a.sql_text,
a.action
from v$sqlarea a, v$session s, v$locked_object l
where l.session_id = s.sid
and s.prev_sql_addr = a.address
order by sid, s.serial#;
4、修改數據庫連接數
ps:當然鎖表也有可能是連接數不夠
- 查看當前的數據庫連接數
select count(*) from v$process ;
- 查看數據庫允許的最大連接數
select value from v$parameter where name ='processes';
- 查看當前的session連接數
select count(*) from v$session
- 查看當前併發連接數
select count(*) from v$session where status='ACTIVE';
- 修改數據最大連接數
alter system set processes = 500 scope = spfile;
- 重啓關閉數據庫
--關閉數據庫
shutdown immediate;
--重啓數據庫
startup;
5、定位慢sql
ok,鎖表問題如果可以定位到,也要順便排查一下哪些慢SQL,在拖系統性能
- 先查詢哪些用戶在使用
select osuser, a.username, cpu_time/executions/1000000||'s', b.sql_text, machine
from v$session a, v$sqlarea b
where a.sql_address =b.address
order by cpu_time/executions desc;
拿出慢sql:
SELECT SQL_TEXT,
SQL_FULLTEXT,
ELAPSED_TIME,
DISK_READS,
BUFFER_GETS,
EXECUTIONS,
Round(ELAPSED_TIME / EXECUTIONS ,2),
ROUND(DISK_READS / EXECUTIONS, 2),
ROUND(BUFFER_GETS / EXECUTIONS , 2),
ROUND((BUFFER_GETS - DISK_READS) / BUFFER_GETS, 2)
FROM V$SQLAREA
WHERE EXECUTIONS > 0
AND BUFFER_GETS > 0
AND (BUFFER_GETS - DISK_READS) / BUFFER_GETS < 0.8
ORDER BY Round(ELAPSED_TIME / EXECUTIONS ,2) desc;
然後解釋一下這些意義:
Round(ELAPSED_TIME / EXECUTIONS ,2):求每個遊標執行SQL需要的時間
ROUND(DISK_READS / EXECUTIONS, 2):求每個遊標執行SQL需要讀磁盤的次數
ROUND(BUFFER_GETS / EXECUTIONS , 2):求每個遊標執行SQL需要讀內存的次數
ROUND((BUFFER_GETS - DISK_READS) / BUFFER_GETS, 2) :SQL命中率
然後和同事找到一個問題,發現一個業務邏輯裏主鍵的生成是用數字加上事務控制生成的,在這種情況表就經常出現被鎖表的情況
結合druid的監控,然後在阿里druid框架的官網找到如下的wikihttps://github.com/alibaba/druid/wiki/%E8%BF%9E%E6%8E%A5%E6%B3%84%E6%BC%8F%E7%9B%91%E6%B5%8B
發現公司性能這個監控被開起來了,所以一個是因爲程序問題,加上框架的使用不當,導致的。ok,性能問題是一個很花時間的問題,本博客只進行一些簡單的分享,僅供參考