淺析設計高可用數據庫連接池(多線程)的核心要點與技術原理以及處理線程的安全問題

前不久有倆個盆友和我探討這些問題,我做了個簡單的總結分享給打架,明天就是國慶了祝大家玩的開心,主要分享設計數據庫連接池原理以及要處理關鍵點,本文只挑選某一種實現方式來簡單闡述,暫不涉及事務相關。關於事務傳播行爲和跨庫事務(包括2PC和TCC),過段時間再做分享!

那我們先引出問題,就從沒有數據庫連接池的時候說起吧(圖就不畫了,網上截一個)!!!

缺點:首先,每一次web請求都要建立一次數據庫連接。建立連接通常需要消耗相對較大的資源(包括分配內存資源)。這個時間對於一次或幾次數據庫操作,或許感覺不出系統有多大的開銷。對於如今的web應用,尤其是大型電商網站,同時有幾百人甚至幾千人在線訪問。這種情況下頻繁的進行數據庫連接操作勢必佔用很多的系統資源,進而影響網站的響應速度,嚴重的話甚至會造成服務器的癱瘓。還有對於每一次數據庫連接,使用完後都得斷開。如果程序出現異常而未能關閉,將會導致數據庫系統中的內存泄漏,最終結果必定是重啓數據庫。還有,這種開發被創建的連接對象數不能控制,系統資源被毫無顧及的分配,連接數量過多,也可能會導致內存泄漏,服務器崩潰。

數據庫連接是一種關鍵的有限的昂貴的資源,這一點在多用戶的網頁應用程序中體現的尤爲突出.對數據庫連接的管理能顯著影響到整個應用程序的伸縮性和健壯性,影響到程序的性能指標.數據庫連接池就是針對這個問題提出來的.數據庫連接池負責分配,管理和釋放數據庫連接,它允許應用程序重複使用一個現有的數據庫連接,而不是重新建立一個。如下圖所示:

我們做一個對比:

對於傳統的通過傳入jdbcUrl用Drivermanager.getConnection(jdbcUrl)來連接數據庫:

Class.forName("com.mysql.jdbc.Driver");
java.sql.Connection conn = DriverManager.getConnection(jdbcUrl);

注意:一次Drivermanager.getConnection(jdbcurl)獲得只是一個connection,並不能滿足高併發情況。因爲connection不是線程安全的,一個connection對應的是一個事物。簡單舉個例子:線程A剛剛獲得這個connection開啓了一個事務,還沒來得及做些什麼,線程B直接提交了這個事務。他們使用的都是同一個Connection,這個就是致命的了,,算上延遲啥的天知道數據會成什麼樣。

數據庫連接池是多次Drivermanager.getConnection(jdbcurl),獲取多個connection放入map中。每次從map.getConnection(),都是先從threadlocal裏面拿的,如果threadlocal裏面有,則用,如果新線程,則將新的connection放在threadlocal裏,再get給到線程。實現一個線程裏進行多次DAO操作,用的是同一個connection,以保證這個事務完整。

        至於爲什麼要用ThreadLocal呢?這個和連接池無關,我認爲更多的是和程序本身相關,那麼它又是怎麼保證線程安全呢?

要編寫一個多線程安全的程序是困難的,爲了讓線程共享資源,必須小心翼翼的對共享資源進行同步,同步帶來一定的效能延遲,而另一方面,在處理同步的時候,又要注意對象的鎖定與釋放,避免死鎖,種種因素都使得編寫多線程程序變得困難。那麼我們嘗試換個角度來思考多線程下資源共享的問題:既然共享資源如此困難,乾脆就不要共享了,我們爲每個線程創造一個資源的副本。將每一個線程存取數據的行爲加以隔離,實現的方法就是給予每個線程一個特定空間來保管該線程所獨享的資源。

這時候就用到了ThreadLocal,實質上他就是一個線程局部變量(local variable)。它的功用非常簡單,就是爲每一個使用該變量的線程都提供一個變量值的副本,是每一個線程都可以獨立地改變自己的副本,而不會和其它線程的副本衝突。從線程的角度看,就好像每一個線程都完全擁有該變量。使用場景:1.To keep state with a thread (user-id, transaction-id, logging-id);2.To cache objects which you need frequently.

ThreadLocal是如何做到爲每一個線程維護變量的副本的呢?其實思路很簡單,在ThreadLocal類中有一個Map,用於存儲每一個線程的變量的副本。它主要由四個方法組成initialValue(),get(),set(T),remove(),其中值得注意的是initialValue(),該方法是一個protected的方法,顯然是爲了子類重寫而特意實現的。該方法返回當前線程在該線程局部變量的初始值,這個方法是一個延遲調用方法,在一個線程第1次調用get()或者set(Object)時才執行,並且僅執行1次。ThreadLocal中的確實實現直接返回一個null。我們來看一段源碼代碼,hibernate是如何使用ThreadLocal管理多線程訪問的。

public static final ThreadLocal session = new ThreadLocal();
public static Session currentSession() {
  Session s = (Session)session.get();
    //open a new session,if this session has none
 if(s == null){
    s = sessionFactory.openSession();
     session.set(s);
  }
   return s;
}

做個簡單的分析:
1.初始化一個ThreadLocal對象,ThreadLocal有三個成員方法 get()、set()、initialvalue()。如果不初始化initialvalue,則initialvalue返回null。
2. session的get根據當前線程返回其對應的線程內部變量,也就是我們需要的net.sf.hibernate.Session(相當於對應每個數據庫連接).多線程情況下共享數據庫連接是不安全的。ThreadLocal保證了每個線程都有自己的s(數據庫連接)。
3.如果是該線程初次訪問,自然s(數據庫連接)會是null,接着創建一個Session,具體就是這行代碼:s = sessionFactory.openSession()。
4.創建一個數據庫連接實例 s
5.保存該數據庫連接s到ThreadLocal中。
6.如果當前線程已經訪問過數據庫了,則從session中get()就可以獲取該線程上次獲取過的連接實例。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章