監控和剖析數據庫操作 -- P6Spy、SQL Profiler、IronTrack SQL 使用簡介


監控和剖析數據庫操作 -- P6Spy、SQL Profiler、IronTrack SQL 使用簡介

c.gif

c.gif
c.gif
文檔選項




c.gif printer.gif

打印本頁





c.gif em.gif

將此頁作爲電子郵件發送

未顯示需要 JavaScript 的文檔選項



級別: 初級


俞 黎敏 ([email protected]), 技術顧問, OCSolutions


2007 年 7 月 30 日


本文介紹如何在應用程序中利用 P6Spy、SQL Profiler、IronTrack SQL 工具來對數據庫操作進行監控與剖析,從中發現應用系統存在的性能瓶頸,得到相關的優化建議並最終找到相應的解決辦法。

c.gif

幾乎 80% - 85% 的數據庫性能問題是由於應用數據庫的設計或者應用程序本身的代碼所引起的。因此良好的事務處理能力需要在設計應用程序的時候,在設計數據庫的時候就考慮到性能和伸縮性。


---- DB2 Magazine


在我們 Java 開發應用程序的過程中,難免會碰到系統的性能問題,特別在企業應用的開發過程中,都會與數據庫進行打交道。當我們碰到數據庫性能時,最有效的就是直接跟蹤每一個 SQL 語句的執行情況,SQL 語句的優化、索引的優化往往也是最容易取得最直接的效果的。


下面,我們首先開始介紹 P6Spy 這個剖析工具,看它是如何無侵入性地進行數據庫操作的監控與剖析。


P6Spy


P6Spy 是一個可以用來在應用程序中攔截和修改數據操作語句的開源框架。通過 P6Spy 我們可以對 SQL 語句進行攔截,相當於一個 SQL 語句的記錄器,這樣我們可以用它來作相關的分析,比如性能分析。P6Spy 用 Log4J 來記錄 JDBC 調用的日記信息。


自從 2003 年 11 月 30 日 P6Spy 版本 1.3 發佈後,已經被下載超過 19,000 次了。P6Spy 支持 WebSphere、WebLogic、JBoss、Resin 和 Tomcat 等絕大多數的應用服務器。


使用步驟


首先,你的應用系統應當是基於數據庫的,然後你需要去獲取 P6Spy 相關的文件(在 參考資源 中可以找到下載鏈接,您可以直接下載軟件包)。下面介紹 P6Spy 的安裝與使用的詳細操作過程:



  1. 下載 P6Spy 的文件包,也可以下載它的源文件包來研究;
  2. 把 P6Spy 的 jar 包 p6spy.jar 放到 CLASSPATH 中,如果是 Web 應用程序則放在 YourWebApp/WEB-INF/lib/ 目錄下;
  3. 把 spy.properties 放到 CLASSPATH 目錄下,如果是 Web 應用程序放在 YourWebApp/WEB-INF/classess/ 目錄下,注意不是 lib/ 目錄
  4. 修改你應用系統中的數據庫驅動名稱爲 P6Spy 的驅動程序名稱 com.p6spy.engine.spy.P6SpyDriver 其它的全部使用默認值,暫時先都不用修改;
  5. 打開配置文件 spy.properties 文件,找到 realdriver,把它的值改爲你的應用系統的真正的數據庫驅動名稱;
  6. 運行你的應用程序或 Web 應用程序,可以在 spy.log 裏看到 P6Spy 監測到的 SQL 詳細的執行與操作的記錄信息了,包含有完整的 SQL 執行參數。

P6Log 與 P6Outage


在 P6Spy 發佈包中,它包含 P6Log 和 P6Outage 兩個模塊:



  1. P6Log

    P6Log 是用來攔截和記錄任務應用程序的 JDBC 語句的。這個功能對於開發者監控 EJB 服務器上的 SQL 語句執行情況尤其有用,可以讓開發者完成儘可能高效的代碼。同時 P6Spy 的部署是極其簡單的,而且根本不需要更改任何一行代碼,即對現有的應用是無侵入性的。


    realdriver= (your driver)       (你的實際 JDBC 驅動程序名稱)
    
    executionthreshold=整數時間 (以毫秒爲單位)


  2. P6Outage

    P6Outage 專門用來檢測和記錄執行時間比較長的 SQL 語句,P6Outage 只記錄超過配置條件裏時間的那些信息,並對可能影響到數據庫的運行效率減小到最低。


    #outagedetection=true|false    (是否記錄較長時間運行的語句)
    
    #outagedetectioninterval=整數時間 (以秒爲單位)


架構原理


簡單地講,我們可以認爲 P6Spy 就是一個代理(Proxy),它只做了一層對 JDBC 驅動的攔截,然後轉發出去,這樣的設計與實際的應用程序沒有任何的耦合性,除了在配置中將驅動程序改成 P6Spy 的攔截驅動外,程序其他地方並不需要做任何的改變。這層攔截器除了可能會給系統帶來略微的性能下降外,對程序其他方面沒有任何的影響。而相對於這一點點的性能下降,在開發環境中對於開發人員來說是無法感覺到,相比它所帶來的好處,完全可以忽略不計。


圖 1. P6Spy 對數據庫進行攔截監控的處理過程
fig001.jpg

問題與解決


如果在你的應用程序啓動後,卻在 spy.log 文件中發現瞭如下的提示信息,那就是驅動程序加載先後的問題了。


<你的程序的數據庫驅動名稱> is a real driver in spy.properties, but it has 

been loaded before p6spy. p6spy will not wrap these connections. Either
prevent the driver from loading, or try setting'deregisterdrivers' to true in
spy.properties


請把 spy.properties 配置文件裏的 deregisterdrivers=false 改爲 deregisterdrivers=true,重新運行即可。


這是因爲有些應用系統中會先於 P6Spy 加載了真正的數據庫的驅動程序,導致 P6Spy 無法監控到,設置 deregisterdriverstrue,是顯式地把真正的數據庫的驅動程序進行反註冊掉,而採用 P6Spy 的驅動程序。


配置參數及相關意義


下表列出了 spy.properties 配置文件中的各配置項的名稱、默認值及其意義和相關注意事項:


配置項名稱 默認值 配置項意義及相關注意事項
module.log com.p6spy.engine.logging. P6LogFactory 用來攔截和記錄任務應用程序的 JDBC 語句。若無配置或註釋掉則無此功能。
module.outage com.p6spy.engine.outage. P6OutageFactory 檢測和記錄執行時間比較長的 SQL 語句。若無配置或註釋掉則無此功能。
realdriver   真正的應用系統使用的數據庫驅動程序名稱。
realdriver2   真正的應用系統使用的第二種備用數據庫驅動程序名稱。
realdriver3   真正的應用系統使用的第三種備用數據庫驅動程序名稱。
deregisterdrivers false 顯示地把真正的數據庫的驅動程序進行反註冊掉。取值 true| false
executionthreshold   P6Log 模塊執行時間設置,整數值 (以毫秒爲單位),只有當超過這個時間才進行記錄 Log。
outagedetection false P6Outage 模塊是否記錄較長時間運行的語句。取值 true| false
outagedetectioninterval   P6Outage 模塊執行時間設置,整數值 (以秒爲單位)),只有當超過這個時間才進行記錄 Log。
filter false 是否過濾 Log,取值 true| false
include   過濾 Log 時所包含的表名列表,以逗號分隔。
exclude   過濾 Log 時所排除的表名列表,以逗號分隔。
sqlexpression   過濾 Log 時的 SQL 表達式名稱
autoflush true 是否自動刷新。取值 true| false
dateformat   設置時間的格式,也就是用 Java 的 SimpleDateFormat 程序。
includecategories   顯示指定過濾 Log 時包含的分類列表,取值爲 error,info,batch,debug,statement,commit,rollback,result 的各種組合。
excludecategories   顯示指定過濾 Log 時排隊的分類列表,取值同上。
stringmatcher   使用正則表達式來過濾 Log,取值爲 com.p6spy.engine.common.GnuRegexMatcher 和 com.p6spy.engine.common.JakartaRegexMatcher
stacktrace false 打印堆棧跟蹤信息。取值 true| false
stacktraceclass   如果 stacktrace=true,則可以指定具體的類名來進行過濾。
reloadproperties false 監測屬性配置文件是否進行重新加載。取值 true| false
reloadpropertiesinterval 60 屬性配置文件重新加載的時間間隔,以秒爲單位。
useprefix false 是否加上前綴,設置爲 true,會加上 p6spy: 作爲前綴。取值 true| false
appender com.p6spy.engine.logging. appender.FileLogger 指定 Log 的 appender,與 Log4J 有點同義,取值:com.p6spy.engine.logging.appender.Log4jLogger、com.p6spy.engine.logging.appender.StdoutLogger 和 com.p6spy.engine.logging.appender.FileLogger
logfile spy.log 指定 Log 的文件名,任何適於操作系統的文件。
append true 指定是否每次是增加 Log,設置爲 false 則每次都會先進行清空。取值 true| false
log4j.appender.STDOUT org.apache.log4j.ConsoleAppender 當 appender 爲 log4j 時採用的配置,配置如同 Log4J 的相關配置。
log4j.appender.STDOUT.layout org.apache.log4j.PatternLayout 同上
log4j.appender.STDOUT. layout.ConversionPattern p6spy - %m%n 同上
log4j.logger.p6spy INFO,STDOUT Log 級別的設置,取值同 Log4J 的配置
realdatasource   設置數據源 DataSource 的配置名稱。
realdatasourceclass   設置數據源 DataSource 的類的全稱。
realdatasourceproperties   設置數據源 DataSource 的屬性,以分號分隔。
jndicontextfactory   設置 JNDI 數據源的 NamingContextFactory。
jndicontextproviderurl   設置 JNDI 數據源的提供者的 URL。
jndicontextcustom   設置 JNDI 數據源的一些定製信息,以分號分隔。


blue_rule.gif
c.gif

c.gif

u_bold.gif
回頁首



SQL Profiler


SQL Profiler 是一個由 Jahia.org 提供的基於 P6Spy 引擎的快速剖析工具,用來統計 SQL 查詢語句以便了解哪裏是性能瓶頸,在哪裏創建索引或者採取相應的辦法才能提高效率,並且能根據 SQL 查詢語句的情況幫你生成合適的索引腳本。


這個小工具可以實時地顯示數據庫查詢的情況,通過集成的 SQL 解析器,在訪問大多數表與列上面建立統計分析,並生成索引腳本。當然,其它的信息也會進行收集和顯示,比如:單個數據庫請求的時間、一類請求的時間以及所有請求的時間。因此,可以有效地通過視圖的排序來檢測數據的性能問題所在。這個工具對於大量的需要進行分析的請求是非常有用的,而不是人工一個個地去做分析。當你需要知道比如對相同的表和列進行訪問但是採用不同的查詢值時,這種分組的查詢可以用建立在 ANTLR 上的 SQL 解析器進行分析。


使用步驟


首先,你的應用系統同樣也應當是基於數據庫的,然後你需要去獲取 SQL Profiler 相關的文件(在 參考資源 中可以找到下載鏈接,您可以直接下載軟件包)。下面介紹 SQL Profiler 的安裝與使用的詳細操作過程:



  1. 下載 SQL Profiler 的文件包進行安裝;
  2. 把 p6spy.jar 及 sqlprofiler.jar 放到 CLASSPATH 中,如果是 Web 應用程序則放在 YourWebApp/WEB-INF/lib/ 目錄下;
  3. 把 spy.properties 放到 CLASSPATH 目錄下,如果是 Web 應用程序就放在 YourWebApp/WEB-INF/classess/ 目錄下,注意不是 lib/ 目錄;
  4. 修改你應用系統中的數據庫驅動名稱爲 P6Spy 的驅動程序名稱 com.p6spy.engine.spy.P6SpyDriver 其它的全部使用默認值,暫時不用修改;
  5. 打開 spy.properties 文件,把 realdriver 的值改爲你的程序的數據庫驅動名稱;
  6. 注意要先運行 java -jar sqlprofiler.jar 來啓動 SQL Profiler,併成功看到啓動界面;
  7. 然後再啓動你的應用程序或服務器,並開始進行正常的系統請求處理操作;
  8. 這樣就可以在 SQL Profiler 圖形化的界面上看到結果並進行分析了。

分析結果


經過一段時間的系統運行後,點擊 Pause 按鈕停止攔截,可以得到分析結果如下圖:


圖 2. SQL Profiler 的分析結果 Profiler 視圖
fig002.jpg

接着,可以切換到 Loggers 視圖,這是 Lgger 視圖的信息:


圖 3. SQL Profiler 的分析結果 Logger 視圖
fig003.jpg

當然,也可以切換到 Analysis 視圖,這是 Analysis 視圖的分析結果信息:


圖 4. SQL Profiler 的分析結果 Analysis 視圖
fig004.jpg

在經過分析後,我們可以直接通過 SQLProfiler 提交的保存按鈕,直接導出應當進行數據庫優化的建議的索引腳本,通過查看索引腳本,我們可以看到創建索引的詳細 SQL 腳本,這樣,我們就可以非常方便地進行數據庫調優了。


問題與解決


最後一個需要注意的問題就是需要先啓動 SQLProfiler,然後再啓動應用程序或者 Tomcat 等應用服務器。這是因爲 SQLProfiler 默認使用的是 Log4j 的 SocketAppender,所以要先啓動。否則,會因你的應用程序或應用服務器中的 Web 應用之類的因連接不到 Socket 的服務器(SQLProfiler 相當於 Socket 的服務器)而發生錯誤,可以通過 SQL Profiler 控制界面最下面的連接狀態就可以知道是否有程序連接上來。


圖 5. SQL Profiler 處於非連接狀態
fig005.jpg

圖 6. SQL Profiler 處於連接狀態
fig006.jpg


blue_rule.gif
c.gif

c.gif

u_bold.gif
回頁首



IronTrack SQL


IronEye,一個專注於 JDBC 性能的監控和測試的開源項目,它包含有三個工具:IronEye SQL,IronEye Cache,IronTrack SQL。其中,IronEye SQL 用於監測 Java 應用和數據庫服務器之間查詢開銷的時間,診斷在性能方面是否存在着相關問題,讓開發人員在測試之前就能發現問題。IronEye 於 2003 年 10 月 1 日開始基於 Apache Software License 發佈。


IronEye SQL 這個輕量級的 Java 工具提供所有流動在數據庫與應用程序之間的 SQL 統計信息並用多張圖表展現,可以快速優化程序的性能。


IronGrid 相對於 Continuous Integration 提出了 Continuous Performance 的概念,即在項目開發過程中隨時關注性能問題,而不是傳統的出了問題再解決的方案。


IronGrid 在應用程序對數據庫的操作上的 Continuous Performance 是通過 IronTrack SQL 進行體現的。IronTrack SQL 能通過對 JDBC 的包裝來攔截應用程序對數據庫的請求,完成性能監控。IronTrack SQL 的好處在於不需要修改任何代碼或者在數據庫端安裝任何程序,只需要在測試時把依賴的 JDBC 替換就可以了。


使用步驟


首先,你的應用系統同樣也應當是基於數據庫的,然後你需要去獲取 IronTrack SQL 相關的文件(在 參考資源 中可以找到下載鏈接,您可以直接下載軟件包)。下面介紹 IronTrack SQL 的安裝與使用的詳細操作過程:



  1. 下載 IronTrack SQL 的文件包進行安裝;
  2. 把 irontracksql.jar, p6spy.jar 和 log4j-1.2.8.jar 放到 CLASSPATH 中,如果是 Web 應用程序則放在 YourWebApp/WEB-INF/lib/ 目錄下;
  3. 把 spy.properties 放到 CLASSPATH 目錄下,如果是 Web 應用程序就放在 YourWebApp/WEB-INF/classess/ 目錄下,注意不是 lib/ 目錄;
  4. 修改你程序的數據庫驅動名稱爲 P6Spy 的驅動程序名稱 com.p6spy.engine.spy.P6SpyDriver 其它的都不用更改;
  5. 打開配置文件 spy.properties 文件,找到 realdriver,把它的值改爲你的應用系統的真正的數據庫驅動名稱;
  6. 設置監聽端口號 monitorport=2000
  7. 先運行 java -jar irontracksql.jar 來啓動 IronTrack SQL;
  8. 再啓動你的應用程序或服務器;
  9. 可以在 IronTrack SQL 圖形化的界面上看到結果並進行分析了。

連接設置


點擊“Config”按鈕就可以設置主機名、端口與刷新的時間(毫秒爲單位)。根據你的服務器與端口的不同而進行相應地改變,下面以本地和 2000 端口,刷新時間爲 500 毫秒爲示例。設置完成後,確定,點擊“Connect”就可以連接應用系統並進行監測與分析了,當要停止分析時,只要點擊“Disconnect”按扭即可立刻停止分析了。


在分析的過程中,我們可以根據需要點擊“Purge”按鈕,它可以清除目前所監測到的內容,然後重新進行記錄監測信息,很方便地進行重新開始。


圖 7. IronTrack SQL 連接示例
fig007.jpg

分析結果


經過一段時間的系統運行後,我們可以直接得到分析的結果與相應的圖形分析示例。相關的信息顯示如下:


圖 8. IronTrack SQL 分析結果
fig008.jpg


  • Count 列顯示 SQL 語句的調用次數;
  • Avg Time 列顯示 SQL 語句的執行平均時間;
  • Max Time 列顯示 SQL 語句花費的最高時間;
  • SQL 列顯示真正執行的 SQL 語句內容。

同時也可以通過設置過濾條件來顯示指定條件的結果,比如:只關注平均調用次數大於 100 次 的結果。點擊“Filtering”左邊的小三角圖標,可以顯示如下的過濾條件設置欄目:


圖 9. IronTrack SQL 設置相關的過濾條件
fig009.jpg

設置完成後,點擊“Apply Filter”按鈕即可以獲取所需要的相關結果了。這樣可以更加方便地集中精力進行所需要的內容分析,可以更加方便快速地定位到問題的所在之處,然後進行解決。



blue_rule.gif
c.gif

c.gif

u_bold.gif
回頁首



總結


通過使用 P6Spy、SQL Profiler、IronTrack SQL 工具,我們可以無侵入已有的應用系統而有效地進行數據庫操作的監控與剖析,爲發現系統的性能瓶頸,尋找系統的性能調優提供了相當便利的方法。




參考資料

學習


獲得產品和技術




關於作者


c.gif

yulm.jpg

c.gif

俞黎敏(ID:YuLimin,網名:阿敏總司令),深入瞭解電力、電信行業的系統,並負責核心系統研發與管理工作。開源愛好者,曾經參與滿江紅開源組織 Spring 2.0 Reference 中文翻譯的一審與二審工作和 Seam 1.2.1 Reference 中文翻譯工作,《CSS: The Missing Manual》中文版譯者,《Java Persistence with Hibernate》中文版譯者,並擔任 CSDN、CJSDN、Dev2Dev、Matrix、JavaWorldTW 等 Java 論壇版主,在各大技術社區推動開源和敏捷開發作出了積極的貢獻,目前在組織 Seam 2.0 Reference 中文翻譯工作,歡迎開源的愛好者們積極報名參與。博客:http://YuLimin.JavaEye.com





本文轉自
http://www.ibm.com/developerworks/cn/java/j-lo-p6spy/index.html#resources
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章