一次weblogic調優的經過(StuckThreadMaxTime) of "600" seconds)

此問題一般是因爲執行語句時間過長，超過了weblogic設定的“粘滯線程最長時間”的值，導致資源排隊，處理超時導致。大量的請求可能導致大量資源請求隊列，嚴重時導致weblogic崩潰。

處理辦法：1、修改weblogic的服務器配置參數（增加粘滯線程最長時間的值）

2、優化導致處理超時的sql語句，使其執行時間縮短，在設定的時間範圍內（大數據量）

3、增大線程數，防止線程阻塞問題

------------------------------------

一次weblogic調優的經過

項目組反應數據庫有問題，
檢查發現sga還用的默認參數，緩衝區命中率很低。根據系統內存調整後，好像系統正常了。數據庫調整就算是結束了
一天後，我再登這個數據庫的時候，發現一個提示說線程已經超過限制，不允許再登錄。然後我去修改了process到250，增加併發連接數。然後重啓了數據庫。當天沒發生什麼事情，第二天，發現250又被撐滿了，這個時候，我就開始換衣中間件有問題，登入中間件那邊看了下日誌，一直報錯，提示無法打開新的連接。一般來說，中間件連接數據庫能開10個都算可以了。至少websphere是這樣，weblogic應該差不多。然後修改了一下，調整了weblogic的連接池，修改最大連接到100.

1、報錯信息

<2008-4-22 上午04時33分18秒 CST> <Error> <WebLogicServer> <BEA-000337> <ExecuteT
hread: '1' forqueue: 'weblogic.kernel.Default' has been busy for "102" seconds
working on the request "Http Request: /guestAction.jsp", which is more than the
configured time (StuckThreadMaxTime) of "60" seconds.>
<2008-4-22 上午04時33分18秒 CST> <Error> <WebLogicServer> <BEA-000337> <ExecuteT
hread: '7' forqueue: 'weblogic.kernel.Default' has been busy for "178" seconds
working on the request "Http Request: /guestAction.jsp", which is more than the
configured time (StuckThreadMaxTime) of "60" seconds.>
<2008-4-22 上午04時34分18秒 CST> <Error> <WebLogicServer> <BEA-000337> <ExecuteT
hread: '0' forqueue: 'weblogic.kernel.Default' has been busy for "111" seconds
working on the request "Http Request: /guestAction.jsp", which is more than the
configured time (StuckThreadMaxTime) of "60" seconds.>
<2008-4-22 上午04時34分18秒 CST> <Error> <WebLogicServer> <BEA-000337> <ExecuteT
hread: '1' forqueue: 'weblogic.kernel.Default' has been busy for "162" seconds
working on the request "Http Request: /guestAction.jsp", which is more than the
configured time (StuckThreadMaxTime) of "60" seconds.>
<2008-4-22 上午04時35分18秒 CST> <Error> <WebLogicServer> <BEA-000337> <ExecuteT
hread: '0' forqueue: 'weblogic.kernel.Default' has been busy for "171" seconds
working on the request "Http Request: /guestAction.jsp", which is more than the
configured time (StuckThreadMaxTime) of "60" seconds.>
<2008-4-22 上午04時35分18秒 CST> <Error> <WebLogicServer> <BEA-000337> <ExecuteT
hread: '12' forqueue: 'weblogic.kernel.Default' has been busy for "111" seconds
working on the request "Http Request: /guestAction.jsp", which is more than the
configured time (StuckThreadMaxTime) of "60" seconds.>
<2008-4-22 上午04時36分18秒 CST> <Error> <WebLogicServer> <BEA-000337> <ExecuteT
hread: '12' forqueue: 'weblogic.kernel.Default' has been busy for "171" seconds
working on the request "Http Request: /guestAction.jsp", which is more than the
configured time (StuckThreadMaxTime) of "60" seconds.>
2、判斷可能存在部分sql語句未優化，造成執行時間過長（request超時）造成掛死

3、解決
開發模式和產品模式的一些參數的默認值不同，可能會對性能造成影響，下面是對性能有影響的參數列表：
參數開發模式默認值產品模式默認值
Execute Queue: Thread Count 15 threads 25 threads
JDBC Connection Pool: MaxCapacity 15 connnections 25 connections
通過啓動管理控制檯，在域（如：mydomain）> 配置 > 常規選擇產品模式。

修改了server-myserver參數中的threadcount參數，按照cpu數量，修改爲100
修改jdbc數據庫連接池，修改爲初始15，最大100。

晚間進行跟蹤，系統運行正常，高峯時段，尤其是早晨的高峯時段，系統沒有再出現掛死的問題。
早晨點擊頁面查詢發現有時會出現頁面無法訪問的情況。
跟蹤發現weblogic最高時有100多併發，同時注意到內存佔用比較高，檢查發現，原來內存配置較低。

檢查原配置文件：
:bea
if "%PRODUCTION_MODE%" == "true" goto
bea_prod_mode
set JAVA_VM=-jrockit
set MEM_ARGS=-Xms96m -Xmx256m
set
JAVA_OPTIONS=%JAVA_OPTIONS% -Xverify:none
goto
continue
:bea_prod_mode
set JAVA_VM=-jrockit
set MEM_ARGS=-Xms128m
-Xmx256m
goto continue

:sun
if "%PRODUCTION_MODE%" == "true" goto sun_prod_mode
set
JAVA_VM=-client
set MEM_ARGS=-Xms32m -Xmx200m -XX:MaxPermSize=128m
set
JAVA_OPTIONS=%JAVA_OPTIONS% -Xverify:none
goto
continue
:sun_prod_mode
set JAVA_VM=-server
set MEM_ARGS=-Xms32m
-Xmx200m -XX:MaxPermSize=128m
goto continue

很明顯配置爲96m，最高256m。修改後的參數：
修改後結果爲
:bea
if "%PRODUCTION_MODE%" == "true" goto
bea_prod_mode
set JAVA_VM=-jrockit
set MEM_ARGS=-Xms256m -Xmx768m
set
JAVA_OPTIONS=%JAVA_OPTIONS% -Xverify:none
goto
continue
:bea_prod_mode
set JAVA_VM=-jrockit
set MEM_ARGS=-Xms256m
-Xmx768m
goto continue

:sun
if "%PRODUCTION_MODE%" == "true" goto sun_prod_mode
set
JAVA_VM=-client
set MEM_ARGS=-Xms256m -Xmx768m -XX:MaxPermSize=128m
set
JAVA_OPTIONS=%JAVA_OPTIONS% -Xverify:none
goto
continue
:sun_prod_mode
set JAVA_VM=-server
set MEM_ARGS=-Xms256m
-Xmx768m -XX:MaxPermSize=128m
goto continue

:continue

最低256，最高768.查看跟蹤信息比較調整前後性能：

調整前內存

調整後情況：

現在垃圾回收不那麼頻繁了，整體穩定性應該有好處。再頻繁打開一個頁面的情況下，頁面仍然能正常顯示。

第二種解決辦法：

最近生產環境下的系統經常出現以下的錯誤提示，
####<2007-7-2 下午04時07分20秒 CST> <Error> <WebLogicServer> <gis> <portalServer> <weblogic.health.CoreHealthMonitor> <<WLS Kernel>> <> <BEA-000337> <ExecuteThread: '5' forqueue: 'default' has been busy for "1,165" seconds working on the request "Http Request: /tzzmWeb/saye/regie/census/customertoMtn/custcheckout.do", which is more than the configured time (StuckThreadMaxTime) of "600" seconds.>
該問題是由於處理custcheckout.do請求超時引起的，系統配置的處理時間是600s，但是該線程處理了1165s後，仍然沒將請求釋放，所以報了這個錯誤。如果發送該請求較多，很有可能會導致weblogic的線程阻塞，嚴重會引起weblogic掛起現象。
可以通過以下幾種方法解決：
1）修改StuckThreadMaxTime參數，將默認的600s改成1200s，或者其它適合的值。
2）增大線程數，防止線程阻塞問題。
3）優化程序，減少處理時間。

第三種解決辦法：

最近，服務器weblogic經常報異常：
<Error> <WebLogicServer> <BEA-000337>
<[STUCK]ExecuteThread: '0' forqueue: 'weblogic.kernel.Default (self-tuning)'has been busy for "640" seconds working on the request "Http Request: /jsp/cn/modelshow/m_hbrow.jsp", which is more than the configured time (StuckThreadMaxTime) of "600"seconds.

該異常出現的原因是資源請求的時間超出了weblogic設定的600s，造成資源排隊請求，如果類似的操作很多的話，那麼會造成大面積的資源請求隊列，從而引起weblogic無法正常提供服務，嚴重時引起weblogic崩潰。那麼這種原因是如何導致的呢？

首先，我們從測試服務器上發現，出現這種情況的原因是因爲該請求的時間過長，於是從該請求的數據處理過程入手進行分析，發現該請求的sql語句，在sql/plus下執行時間過長，如下：
select c.*
from (
select t.*,rownum r
from (
select RGGT_ID,CPMC,PPMC,TITLE,MTMC,
MTRQ,WZZT,LRRQ,INFO_SIGN,ZYMC,BRIEF
from co1003_2239_data
where (1=1)
and (
INFO_SIGN in ('網絡新聞','媒體電子版','品牌新聞')
and PPMC <> '業內動態'
)
order by mtrq desc,ppmc desc
) t
) c
where rownum<21

該表大概225W數據，在sql/plus下執行時間超長，造成請求weblogic反應時間超出默認值，從而引起資源排隊請求的問題，引起服務器不穩定運行。那麼出現了這種問題，怎麼解決呢？我們的解決方法是對該sql語句進行優化處理：
1:對INFO_SIGN,PPMC等字段建立規範表，從數據庫中進行查詢，儘量減少in的使用
2:對<>等操作符不使用,使用> or <等方式來代替
3:儘量減少排序order by，rownum的使用，只在關鍵時刻進行使用，其他時刻能夠不使用的就不進行使用。

通過以上方式來減少資源請求時間，從而減少以上異常的發生，來保證服務器的正常運行。

-------------------

參閱資料：

http://www.cnblogs.com/kaka-bing/archive/2012/08/27/2658894.html

http://blog.csdn.net/mail_bai/article/details/7440940

一次weblogic調優的經過(StuckThreadMaxTime) of "600" seconds)

釘釘打卡速度慢

Nginx R31 doc 官方文檔-01-nginx 如何安裝

Qt/C++音視頻開發74-合併標籤圖形/生成yolo運算結果圖形/文字和圖形合併成一個/水印濾鏡

挑戰程序設計競賽 2.2章習題 POJ - 3617 Best Cow Line 貪心

字節面試：MySQL什麼時候鎖表？如何防止鎖表？

.NET8連接SQL SERVER 2008 R2 報：證書鏈是由不受信任的頒發機構頒發的

golang開發環境搭建(win10)

python計算機視覺學習筆記——PIL庫的用法

Golang初學：獲取程序內存使用情況，std runtime

一次weblogic調優的經過(StuckThreadMaxTime) of "600" seconds)

case when then與decode分析比較

我的友情鏈接

大流量網站的底層系統架構

Weblogic10.3_Windows優化設置

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結