Hibernate的緩存機制介紹

http://cn-java.com/www1/?553689/viewspace-5236

 

     緩存是介於應用程序和物理數據源之間,其作用是爲了降低應用程序對物理數據源訪問的頻次,從而提高了應用的運行性能。緩存內的數據是對物理數據源中的數據的複製,應用程序在運行時從緩存讀寫數據,在特定的時刻或事件會同步緩存和物理數據源的數據。

  緩存的介質一般是內存,所以讀寫速度很快。但如果緩存中存放的數據量非常大時,也會用硬盤作爲緩存介質。緩存的實現不僅僅要考慮存儲的介質,還要考慮到管理緩存的併發訪問和緩存數據的生命週期。

  Hibernate的緩存包括Session的緩存和SessionFactory的緩存

      Session的緩存是內置的,不能被卸載,也被稱爲Hibernate的第一級緩存。

      SessionFactory的內置緩存和Session的緩存在實現方式上比較相似,前者是SessionFactory對象的一些集合屬性包含的數據,後者是指Session的一些集合屬性包含的數據。

      SessionFactory的內置緩存中存放了映射元數據和預定義SQL語句,映射元數據是映射文件中數據的拷貝,而預定義SQL語句是在Hibernate初始化階段根據映射元數據推導出來,SessionFactory的內置緩存是隻讀的,應用程序不能修改緩存中的映射元數據和預定義SQL語句,因此SessionFactory不需要進行內置緩存與映射文件的同步。

     SessionFactory的外置緩存是一個可配置的插件。在默認情況下,SessionFactory不會啓用這個插件。外置緩存的數據是數據庫數據的拷貝,外置緩存的介質可以是內存或者硬盤。SessionFactory的外置緩存也被稱爲Hibernate的第二級緩存。

  Hibernate的這兩級緩存都位於持久化層,存放的都是數據庫數據的拷貝,那麼它們之間的區別是什麼呢?爲了理解二者的區別,需要深入理解持久化層的緩存的兩個特性:緩存的範圍和緩存的併發訪問策略。

  持久化層的緩存的範圍

  緩存的範圍決定了緩存的生命週期以及可以被誰訪問。緩存的範圍分爲三類。

  1 事務範圍:緩存只能被當前事務訪問。緩存的生命週期依賴於事務的生命週期,當事務結束時,緩存也就結束生命週期。在此範圍下,緩存的介質是內存。事務可以是數據庫事務或者應用事務,每個事務都有獨自的緩存,緩存內的數據通常採用相互關聯的的對象形式。

  2 進程範圍:緩存被進程內的所有事務共享。這些事務有可能是併發訪問緩存,因此必須對緩存採取必要的事務隔離機制。緩存的生命週期依賴於進程的生命週期,進程結束時,緩存也就結束了生命週期。進程範圍的緩存可能會存放大量的數據,所以存放的介質可以是內存或硬盤。緩存內的數據既可以是相互關聯的對象形式也可以是對象的鬆散數據形式。鬆散的對象數據形式有點類似於對象的序列化數據,但是對象分解爲鬆散的算法比對象序列化的算法要求更快。

  3 集羣範圍:在集羣環境中,緩存被一個機器或者多個機器的進程共享。緩存中的數據被複制到集羣環境中的每個進程節點,進程間通過遠程通信來保證緩存中的數據的一致性,緩存中的數據通常採用對象的鬆散數據形式。

  對大多數應用來說,應該慎重地考慮是否需要使用集羣範圍的緩存,因爲訪問的速度不一定會比直接訪問數據庫數據的速度快多少。

  持久化層可以提供多種範圍的緩存。如果在事務範圍的緩存中沒有查到相應的數據,還可以到進程範圍或集羣範圍的緩存內查詢,如果還是沒有查到,那麼只有到數據庫中查詢。事務範圍的緩存是持久化層的第一級緩存,通常它是必需的;進程範圍或集羣範圍的緩存是持久化層的第二級緩存,通常是可選的。

  持久化層的緩存的併發訪問策略

  當多個併發的事務同時訪問持久化層的緩存的相同數據時,會引起併發問題,必須採用必要的事務隔離措施。
  在進程範圍或集羣範圍的緩存,即第二級緩存,會出現併發問題。因此可以設定以下四種類型的併發訪問策略,每一種策略對應一種事務隔離級別。

  事務型:僅僅在受管理環境中適用。它提供了Repeatable Read事務隔離級別。對於經常被讀但很少修改的數據,可以採用這種隔離類型,因爲它可以防止髒讀和不可重複讀這類的併發問題。

  讀寫型:提供了Read Committed事務隔離級別。僅僅在非集羣的環境中適用。對於經常被讀但很少修改的數據,可以採用這種隔離類型,因爲它可以防止髒讀這類的併發問題。

  非嚴格讀寫型:不保證緩存與數據庫中數據的一致性。如果存在兩個事務同時訪問緩存中相同數據的可能,必須爲該數據配置一個很短的數據過期時間,從而儘量避免髒讀。對於極少被修改,並且允許偶爾髒讀的數據,可以採用這種併發訪問策略。   

 

      只讀型:對於從來不會修改的數據,如參考數據,可以使用這種併發訪問策略。


  事務型併發訪問策略是事務隔離級別最高,只讀型的隔離級別最低。事務隔離級別越高,併發性能就越低。

  什麼樣的數據適合存放到第二級緩存中?
  1、很少被修改的數據
  2、不是很重要的數據,允許出現偶爾併發的數據
  3、不會被併發訪問的數據
  4、參考數據

  不適合存放到第二級緩存的數據?
  1、經常被修改的數據
  2、財務數據,絕對不允許出現併發
  3、與其他應用共享的數據。

  Hibernate的二級緩存
  如前所述,Hibernate提供了兩級緩存,第一級是Session的緩存。由於Session對象的生命週期通常對應一個數據庫事務或者一個應用事務,因此它的緩存是事務範圍的緩存。第一級緩存是必需的,不允許而且事實上也無法比卸除。在第一級緩存中,持久化類的每個實例都具有唯一的OID。
  第二級緩存是一個可插拔的的緩存插件,它是由SessionFactory負責管理。由於SessionFactory對象的生命週期和應用程序的整個過程對應,因此第二級緩存是進程範圍或者集羣範圍的緩存。這個緩存中存放的對象的鬆散數據。第二級對象有可能出現併發問題,因此需要採用適當的併發訪問策略,該策略爲被緩存的數據提供了事務隔離級別。緩存適配器用於把具體的緩存實現軟件與Hibernate集成。第二級緩存是可選的,可以在每個類或每個集合的粒度上配置第二級緩存。

  Hibernate的二級緩存策略的一般過程如下:
  1) 條件查詢的時候,總是發出一條select * from table_name where …. (選擇所有字段)這樣的SQL語句查詢數據庫,一次獲得所有的數據對象。
  2) 把獲得的所有數據對象根據ID放入到第二級緩存中。
  3) 當Hibernate根據ID訪問數據對象的時候,首先從Session一級緩存中查;查不到,如果配置了二級緩存,那麼從二級緩存中查;查不到,再查詢數據庫,把結果按照ID放入到緩存。
  4) 刪除、更新、增加數據的時候,同時更新緩存。
  Hibernate的二級緩存策略,是針對於ID查詢的緩存策略,對於條件查詢則毫無作用。爲此,Hibernate提供了針對條件查詢的Query緩存。

  Hibernate的Query緩存策略的過程如下:
  1) Hibernate首先根據這些信息組成一個Query Key,Query Key包括條件查詢的請求一般信息:SQL, SQL需要的參數,記錄範圍(起始位置rowStart,最大記錄個數maxRows),等。
  2) Hibernate根據這個Query Key到Query緩存中查找對應的結果列表。如果存在,那麼返回這個結果列表;如果不存在,查詢數據庫,獲取結果列表,把整個結果列表根據Query Key放入到Query緩存中。
  3) Query Key中的SQL涉及到一些表名,如果這些表的任何數據發生修改、刪除、增加等操作,這些相關的Query Key都要從緩存中清空。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章