Oracle SQL調優系列之定位生產性能問題方法

Oracle SQL調優系列之定位生產性能問題方法

1、AWR整體分析

場景:最近遇到緊急生產問題,因爲數據庫鎖表導致業務功能不能正常使用,對於這種緊急問題,首先要安穩心態,然後合理分析問題,可以先從整體出發,拿下Oracle AWR報告,進行整體分析,需要找出是因爲cpu問題,還是具體哪裏的程序導致的

2、JVM命令進行監控

從整體不能定位到問題,還是需要配合JVM的調優命令進行排查問題,監控是否出現oom的情況?

// 監控進程信息
[www@localhost ~]$ top
// 查找具體的線程情況
[www@localhost ~]$ top -H -p PID
// 查看進程id
[www@localhost ~]$ jps -l
//根據jps拿到的PID獲取堆信息,然後使用gcviewer等等工具進行分析
[www@localhost ~]$ jmap -dump:format=b,file=heap.hprof PID
// 直接查看程序堆信息
[www@localhost ~]$ jmap -heap PID
// 查看棧信息,看看是否有程序死鎖的情況
[www@localhost ~]$ jstack PID

gc監控工具:MAT、gcviewer,也可以通過在線網站進行分析https://gceasy.io/

3、拿到鎖表sql

ok,程序排查沒問題,從sql方面進行排查

  • 查看是否有鎖表
SELECT object_name, machine, s.sid, s.serial#
FROM gv$locked_object l, dba_objects o, gv$session s
WHERE l.object_id = o.object_id
AND l.session_id = s.sid;   
  • 釋放數據表鎖
// 釋放SESSION SQL:
alter system kill session 'sid, serial#';
ALTER system kill session '23, 1647';

  • 查看具體的鎖表sql
   
   select l.session_id sid, 
       s.serial#, 
       l.locked_mode, 
       l.oracle_username, 
       s.user#, 
       l.os_user_name, 
       s.machine, 
       s.terminal, 
       a.sql_text, 
       a.action 
  from v$sqlarea a, v$session s, v$locked_object l 
where l.session_id = s.sid 
   and s.prev_sql_addr = a.address 
order by sid, s.serial#;

4、修改數據庫連接數

ps:當然鎖表也有可能是連接數不夠

  • 查看當前的數據庫連接數
select count(*) from v$process ; 
  • 查看數據庫允許的最大連接數
select value from v$parameter where name ='processes';
  • 查看當前的session連接數
select count(*) from v$session
  • 查看當前併發連接數
select count(*) from v$session where status='ACTIVE';
  • 修改數據最大連接數
alter system set processes = 500 scope = spfile; 
  • 重啓關閉數據庫
--關閉數據庫
shutdown immediate; 
--重啓數據庫
startup; 

5、定位慢sql

ok,鎖表問題如果可以定位到,也要順便排查一下哪些慢SQL,在拖系統性能

  • 先查詢哪些用戶在使用
select osuser, a.username, cpu_time/executions/1000000||'s', b.sql_text, machine
from v$session a, v$sqlarea b
where a.sql_address =b.address
order by cpu_time/executions desc; 

拿出慢sql:

SELECT SQL_TEXT,
       SQL_FULLTEXT,
       ELAPSED_TIME,
       DISK_READS,
       BUFFER_GETS,
       EXECUTIONS,
       Round(ELAPSED_TIME / EXECUTIONS ,2),
       ROUND(DISK_READS / EXECUTIONS, 2),
       ROUND(BUFFER_GETS / EXECUTIONS , 2),
       ROUND((BUFFER_GETS - DISK_READS) / BUFFER_GETS, 2) 
  FROM V$SQLAREA 
 WHERE EXECUTIONS > 0
   AND BUFFER_GETS > 0
   AND (BUFFER_GETS - DISK_READS) / BUFFER_GETS < 0.8
   ORDER BY Round(ELAPSED_TIME / EXECUTIONS ,2) desc;

然後解釋一下這些意義:
Round(ELAPSED_TIME / EXECUTIONS ,2):求每個遊標執行SQL需要的時間
ROUND(DISK_READS / EXECUTIONS, 2):求每個遊標執行SQL需要讀磁盤的次數
ROUND(BUFFER_GETS / EXECUTIONS , 2):求每個遊標執行SQL需要讀內存的次數
ROUND((BUFFER_GETS - DISK_READS) / BUFFER_GETS, 2) :SQL命中率

然後和同事找到一個問題,發現一個業務邏輯裏主鍵的生成是用數字加上事務控制生成的,在這種情況表就經常出現被鎖表的情況

結合druid的監控,然後在阿里druid框架的官網找到如下的wikihttps://github.com/alibaba/druid/wiki/%E8%BF%9E%E6%8E%A5%E6%B3%84%E6%BC%8F%E7%9B%91%E6%B5%8B


發現公司性能這個監控被開起來了,所以一個是因爲程序問題,加上框架的使用不當,導致的。ok,性能問題是一個很花時間的問題,本博客只進行一些簡單的分享,僅供參考

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章