NET 連接池救生員——如何監視連接池,防止溢出

發佈日期 : 4/1/2004 | 更新日期 : 4/1/2004

NET 連接池救生員

防止可淹沒應用程序的池溢出

William Vaughn

大多數 ADO.NET 數據提供程序使用連接池,以提高圍繞 Microsoft 斷開連接的 .NET 結構構建的應用程序的性能。應用程序首先打開一個連接(或從連接池獲得一個連接句柄),接着運行一個或多個查詢,然後處理行集,最後將連接釋放回連接池。如果沒有連接池,這些應用程序將花費許多額外時間來打開和關閉連接。

當您使用 ADO.NET 連接池來管理基於 Web 的應用程序和客戶端/服務器 Web 服務應用程序的連接時,您的客戶通常會獲得更快的連接和更好的總體性能。但是,當您的應用程序或 Web 站點上突然涌入了同時希望進行連接的大量客戶時,會發生什麼事情呢?您的應用程序會“沉沒”,還是會“游泳”?就像救生員一樣,您需要仔細監視連接池,以維護它的良好性能,並防止連接池發生溢出。我們首先探討連接池可能溢出的原因,然後討論如何編寫代碼或使用 Windows 性能監視器來監視連接池。

正如我於 2003 年 5 月發表的 "Swimming in the .NET Connection Pool" (InstantDoc ID 38356) 一文中討論的那樣,當您使用連接池時,您需要知道許多有關可伸縮性和性能的詳細信息。請記住,您需要監視和管理兩個基本因素:每個池管理的連接數和連接池的數量。在一個有效的生產系統中,池的數量通常很少(1 到 10),而且,使用中的連接的總數也很少(少於 12 )有效的查詢只用不到一秒鐘的時間就可以完成,並斷開連接。因此,即使有數百個客戶同時訪問您的 Web 站點,相對較少的幾個連接常常足以處理整個負載。爲了使您的應用程序有效地運行,您必須使連接資源處於自己的控制之下,並要監視池的狀態,這樣,在監視池發生溢出以及您的客戶開始抱怨(或離開您的網站)之前您會收到某種警告。

爲什麼會發生連接池溢出?

參加電子郵件討論組的人常常抱怨應用程序是如何在測試中是“龍”而在形成爲產品時就變成了“蟲”的。有時,他們會報告說,當連接了大約 100 個客戶端時,應用程序會停止或掛起。請記住,一個池中的默認連接數是 100。如果您嘗試從池中打開 100 個以上的連接,ADO.NET 會使應用程序的連接請求排隊等候,直到有空閒的連接。應用程序(及其用戶)將這種情況視爲進入 Web 頁的延遲或視爲應用程序死鎖。讓我們首先討論一下這個問題是如何產生的。

在 ADO.NET 中,SqlClient .NET 數據提供程序爲您提供了兩種打開和管理連接的方法。首先,當您需要手工管理連接時,可以使用 DataReader 對象。利用這種方法,您的代碼將構造一個 SqlConnection 對象,設置 ConnectionString 屬性,然後使用 Open 方法來打開連接。當代碼完成 DataReader 後,您要在 SqlConnection 對象停止作用之前關閉 SqlConnection。要處理行集,您可以將 DataReader 傳遞到應用程序中的另一個例程,但仍然需要確保 DataReader 及其連接處於關閉狀態。如果您不關閉 SqlConnection,代碼會“泄漏”每個操作的連接,於是連接池對連接進行累積,最後便發生溢出。與 ADO 和 Visual Basic (VB) 6.0 中的情況不同,.NET 垃圾回收器不會爲您關閉 SqlConnection 並進行清理。我稍後要討論的 清單 1 顯示瞭如何打開連接和生成 DataReader 以從一個簡單的查詢返回行集,來向連接池施加壓力的。

您也可能在使用 DataAdapter 對象時遇到問題。DataAdapter Fill 和 Update 方法可自動打開 DataAdapter 對象的連接,並在數據 I/O 操作完成後關閉該連接。不過,如果該連接在執行 Fill 或 Update 方法時已經處於打開狀態,那麼,ADO.NET 在方法執行完以後不會關閉 SqlConnection。這是另一個發生連接“泄漏”的機會。

此外,您還可以使用基於 COM 的 ADO 從 .NET 應用程序創建連接。ADO 利用與 ADO.NET 相同的方式將這些連接組合成池,但不能像您使用 SqlClient ADO.NET 數據提供程序時那樣,提供從應用程序監視連接池的方式。

指示 DataReader

孤立連接和溢出池是嚴重的問題,根據有關這些問題的新聞組討論的數量來看,它們十分常見。這些問題最有可能是由 DataReader 引起的。爲了測試 DataReader 的行爲,我編寫了一個 Windows 窗體 (WinForms) 示例應用程序,該示例突出了 CommandBehavior.CloseConnection 選項。(您可以在 http://www.sqlmag.com 上輸入 InstantDoc ID 39031 來下載此應用程序)。您可以在使用 SqlCommand 對象的 ExecuteReader 方法來執行查詢並返回 DataReader 時設定此選項。我的測試應用程序顯示,如果不顯式關閉 DataReader(或 SqlConnection),即使使用此選項,連接池還是會溢出。當代碼所請求的連接數超過連接池的容量時,該應用程序就會引發異常。

有些開發人員堅持認爲,如果您設置 CommandBehavior.CloseConnection 選項,則 DataReader 及其相關聯的連接會在 DataReader 完成數據讀取時自動關閉。這些開發人員的看法不完全正確 — 只有當您在 ASP.NET Web 應用程序中使用複雜的綁定控件時,該選項才以這種方式工作。在整個 DataReader 結果集中循環到其行集的末尾(也就是說,當 Dr.Read — DataReader 的 Read 方法 — 返回 False 時)還不足以觸發連接的自動關閉。不過,如果您綁定到一個複雜的綁定控件(例如,DataGrid),該控件則會關閉 DataReader 和連接 — 前提條件是您設置了 CommandBehavior.CloseConnection 選項。

如果您通過使用另一個 Execute 方法(例如,ExecuteScalar、ExecuteNonQuery 和 ExecuteXMLReader)執行查詢,則您需要負責打開 SqlConnection 對象,而且,更重要的是,在查詢結束時關閉該對象。如果您忘記了進行關閉,孤立連接會迅速地積累起來。

監視連接數

爲了對孤立連接和發生溢出的連接池進行測試,我編寫了一個 Web 窗體的示例應用程序。此應用程序使用的方法與您通常用於從查詢返回數據的方法相同。(您可以在 http://www.sqlmag.com 上下載此代碼的 WinForms 版本。)

我使用了清單 1 中的代碼來打開和關閉到 Web 窗體應用程序的連接。標註 A 中的例程針對 110 個新的 SqlConnection 對象創建、打開和執行查詢 — 比默認的池大小多 10 個連接。您必須在離開該例程之前關閉和放棄所有這些連接。如果不這樣做,SqlConnection 對象將連同關聯的池連接一起被孤立。ADO.NET 池機制 (aka the Pooler) 關閉數據庫連接,但不關閉池連接。我將連接池大小設置爲 10,以便使該程序更快地失敗 — 如果該程序會失敗的話。通常,10 個連接對於一個運行速度象這個查詢一樣快的查詢來說已經足夠了。許多開發人員運行着忙碌的 Web 站點,這些 Web 站點使用不到五個連接來處理每天的幾十萬次點擊。

標註 A 中的例程創建 SqlConnection 對象和 SqlCommand 對象,設置 CommandText,並打開連接。然後,標註 B 中的代碼確定執行 DataReader 時是否使用 CommandBehavior.CloseConnection,這取決於用戶在 Web 窗體上選擇了哪些 CheckBox 控件。

在標註 C 的代碼中,我指定是否將 DataReader 行集綁定到 DataGrid,或者是否在整個行集中進行循環。標註 C 的代碼測試當您到達通過 DataReader 從數據提供程序傳遞回來的行集的末尾時會發生什麼事情。

現在,我使用標註 D 中的代碼來指定是手工關閉連接還是讓某個其他操作(例如,數據綁定)來完成這項工作。坦白地說,以手工方式關閉連接通常是最安全的,因此,您可以肯定連接不會被孤立。

如果代碼成功地運行到這一步,說明我已經成功地打開和關閉了 110 個連接。不過,如果出了問題,標註 E 的代碼中的異常處理程序會將異常(通常是 Timeout)作爲 InvalidOperationException 捕獲,該異常是連接池已滿時 ADO.NET 的響應方式。

表 1 彙總了各個選項使例程成功運行或失敗的方式。請注意,如果您不設置 CommandBehavior.CloseConnection 選項,您的操作最終會失敗 — 即使在使用綁定控件的情況下也是如此。即使您使用該選項,但如果您沒有使用複雜的綁定控件,或者沒有手工關閉 SqlDataAdapter 或 SqlConnection,該進程仍然會失敗。

當我結束了這些示例應用程序的運行後,我已經生成了 1000 多個以上的池連接 — 所有連接均處於孤立狀態。雖然“SQL Server 用戶連接”計數爲 0,但留下大約 40 個連接池。在我重新引導系統之前,孤立的池不會消失。

我用於此測試的示例應用程序包括使用 DataAdapter 來返回行的例程。除非您手工管理連接,否則,DataAdapter 將正確地打開和關閉 SqlConnection 對象,因此,您不太可能遇到孤立的池連接。不過,如果您的應用程序同時使用 DataReader 和 DataAdapter,您可能會發現,如果某個連接與一個未關閉的 DataReader 相關聯,則 DataAdapter 無法針對該連接運行查詢。

確定連接池何時達到最大連接數

正如我在 "Swimming in the .NET Connection Pool" 一文中討論的那樣,當連接池達到您通過 "Max Pool Size ConnectionString" 選項指定的最大連接數時,ADO.NET 將阻止任何隨後打開額外連接的嘗試。如果某個連接在您在 "ConnectionTimeout 選項中指定的時間之前變爲可用,.NET 數據提供程序將向您的應用程序傳遞一個指向該連接的指針,以便將控件返回給應用程序。不過,如果沒有及時釋放任何連接,連接請求將引發 InvalidOperationException 異常。

現在您必須決定要採取的措施,我不建議您告訴用戶您已經用完了所有連接。有些應用程序會通知用戶系統正忙於幫助其他客戶,並建議用戶稍後進行訪問。其他應用程序則播放一段動畫,通知用戶系統尚未死鎖,而是正在忙於處理他們的請求。同時,您的代碼重新嘗試操作。在所有情況下,您應該記錄這些故障,以便幫助診斷問題的癥結所在,並記錄您已經耗盡了資源。

監視連接池

您已經打開和關閉了一個連接,現在您希望知道該連接是否仍然處於打開狀態。您可以使用幾種方法來確定有多少連接仍然處於打開狀態,以及它們正在執行何種操作:

  • 運行 sp_who 或 sp_who2。這些系統存儲過程從 sysprocess 系統表返回信息,該系統表顯示所有工作進程的狀態及其有關信息。通常,您會看到每個連接有一個服務器進程 ID (SPID)。如果您是通過在連接字符串中使用 Application Name 參數來命名您的連接的,那麼,您將很容易找到工作的連接。

  • 使用帶有 SQLProfiler TSQL_Replay 模板的 SQL Server 事件探查器來跟蹤打開的連接。如果您很熟悉事件探查器,此方法比通過使用 sp_who 進行輪詢要更容易。

  • 使用性能監視器來監視池和連接。我稍後再討論此方法。

  • 在代碼中監視性能計數器。您可以通過使用例程來提取計數器或通過使用新的 .NET PerformanceCounter 控件來監視連接池的狀況和已建立的連接的數量。這兩種方法都包括在您可以從 http://www.sqlmag.com 進行下載的示例應用程序中。

現在我們將討論如何查找連接池計數器,以及如何使用這些監視方法。

連接池計數器在哪裏? 要監視連接池計數器,您必須監視 ADO.NET 在其中創建和增加這些計數器的系統。如果您從遠程系統進行連接,ADO.NET 並不總是在 Microsoft IIS 服務器或 SQL Server 上創建池;它在 ADO.NET 代碼運行的系統上創建池。此係統可以是運行 IIS、Web 應用程序或 Web 服務的遠程 Windows 或中間層系統。相反,SQL Server 性能計數器位於 SQL Server 系統上 — 而不是客戶端上。

使用性能監視器來監視池。 如果您使用 Microsoft 管理控制檯 (MMC) Windows 2000 系統監視器管理單元,則您可以通過從 Performance 對象下拉列表中選擇 ".NET CLR Data" 來用圖形表示 SqlClient 計數器,如 圖 1所示。請注意,您可以通過選擇 _global_ 計數器實例來監視所有進程,或者,您可以查看某個特定實例 — 每個池生成自己的一組監視器。性能監視器可列出這些計數器,並將它們作爲所選定的性能對象的實例提供。但性能監視器不會公開這些計數器,除非有實例需要它們進行監視。例如,圖 1 顯示了 .NET CLR Data 性能對象,但沒有列出特定實例。這意味着您必須至少創建一個連接,以便使 _global_ 實例連同每個進程的特定實例一起出現。這種行爲對於您的代碼來說是個問題;您將無法使用 PerformanceCounter 控件來返回其中的任何計數器,直到 ADO.NET 在打開連接時創建這些計數器。所以說,這個規定真有點令人左右爲難。當您使用此方法時,因爲缺少有效計數器實例,所以會引發異常 — 此時要準備好捕獲異常。

您還可以通過使用 SQL Server 性能計數器 "User Connections" 來監視打開的連接的數量。該計數器被列在 Performance 對象下拉列表中的 SQL Server: General Statistics 下。我喜歡監視 "User Connections" 值和一些所選定的 .NET CLR Data SqlClient 計數器(我稍後將討論此內容),因爲我可以獲得我需要的信息,而不必擔心實例。

使用代碼來監視性能計數器。 當您需要以編程方式監視連接池時,您可以編寫代碼來監視由 SqlClient 管理的性能計數器 — 這些計數器與 MMC Windows NT 性能監視器管理單元所提供的計數器是相同的。編寫執行監視的代碼似乎是一件有些令人畏懼的事情。但我已經提供了從 SqlClient 提供程序的內部工作提取這些計數器的例程的快照(作爲本文提供的可下載程序之一)。

您可以編寫檢查 表 2顯示的五個計數器的代碼。通過利用這五個計數器,您可以實時監視連接池。.NET 預期您會在性能監視器中提供一個類別 — 複製的 Performance Object — 並從那些註冊到系統的計數器中選擇適當的計數器。要訪問 SqlClient 計數器,請將該類別設置爲 ".NET CLR Data"。

使用 PerformanceCounter 控件。 您可能會發現,在設計時向您的應用程序窗體添加 PerformanceCounter 要比手工編寫代碼來訪問性能計數器更加容易。要使用 PerformanceCounter 控件,請從“Visual Studio .NET 工具箱組件”菜單中選擇一個 PerformanceCounter,將它拖到您的應用程序窗體,然後設置屬性,如 圖 2 所示。這些控件工作在 Web 窗體和 WinForms 應用程序中。

因爲 PerformanceCounter 控件提供了方便的下拉列表,所以,您可以在設計時看到任何一種性能計數器類別、計數器名稱和特定實例 — 您將要運行的實例除外。這意味着您必須使用圖 2 顯示的方法來捕獲應用程序正在使用的池的適當實例。爲了迴避這個問題,我選擇 _global_ 實例。再次說明一下,此方法假設某個應用程序已經至少創建了一個池,因此您需要做好不存在計數器實例時 ADO.NET 引發異常的準備,就像它在不存在池連接時也會引發異常一樣。

注意不準確的池計數。 因爲 SqlClient .NET 數據提供程序中存在 .NET 框架 1.1 尚未解決的錯誤,所以,性能計數器會在池實際上已經刪除時錯誤地指示池“仍然存在”。我能通過結束 MMC 性能監視器管理單元、然後結束 Visual Studio .NET 來驗證池已經不再存在。這些步驟說明,.NET 數據提供程序在創建連接池的進程結束時會正確地刪除連接池。顯然,這種不準確性降低了性能計數器在監視池方面的有效性,所以我希望 Microsoft 將來能解決這個問題。

計數器不顯示的內容

您可能會面臨的一個問題是無法從計數器或 SqlClient 屬性看到每個池的配置。每個 SqlConnection 對象的 ConnectionString 保存着這些池設置的密鑰。因爲您不能依賴於默認設置,所以很難確定池幾乎已滿或很難使用。這會成爲未來版本的 ADO.NET 的另一個方便功能。

不過,假設您知道各個連接池 ConnectionString 參數的值,則利用清單 1 中的代碼,您可以很容易地設置一個計時器來檢查您創建的特定池並報告使用百分比。然後,監視應用程序會向您發出警報,以便您可以解決問題並防止溢出。

最後,請記住,ADO.NET 採用的方法與基於 COM 的 ADO 有所不同。Visual Basic .NET 完全改變了放棄對象的方式,並且不再確保 Connection 對象在停止作用時被關閉。請確保 SqlConnection 對象(或任何 Connection 對象)在停止作用之前被關閉。

連接池是一種非常強大的功能,它可以提高應用程序的性能。但如果您不是一個出色的救生員,您的連接池會成爲一個危害而不是一個優點。我希望本文討論的方法有助於您有效地監視連接池並滿足用戶的需要。

發佈了53 篇原創文章 · 獲贊 2 · 訪問量 18萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章