新技能 MyBatis 千萬數據表,快速分頁!

Python實戰社羣

Java實戰社羣

長按識別下方二維碼,按需求添加

掃碼關注添加客服

進Python社羣▲

掃碼關注添加客服

進Java社羣

作者丨捏造的信仰

來源:

https://segmentfault.com/a/1190000022478915

基本概念

流式查詢指的是查詢成功後不是返回一個集合而是返回一個迭代器,應用每次從迭代器取一條查詢結果。流式查詢的好處是能夠降低內存使用。

如果沒有流式查詢,我們想要從數據庫取 1000 萬條記錄而又沒有足夠的內存時,就不得不分頁查詢,而分頁查詢效率取決於表設計,如果設計的不好,就無法執行高效的分頁查詢。因此流式查詢是一個數據庫訪問框架必須具備的功能。

流式查詢的過程當中,數據庫連接是保持打開狀態的,因此要注意的是:執行一個流式查詢後,數據庫訪問框架就不負責關閉數據庫連接了,需要應用在取完數據後自己關閉。

MyBatis 流式查詢接口

MyBatis 提供了一個叫 org.apache.ibatis.cursor.Cursor 的接口類用於流式查詢,這個接口繼承了 java.io.Closeable 和 java.lang.Iterable 接口,由此可知:

  1. Cursor 是可關閉的;

  2. Cursor 是可遍歷的。

除此之外,Cursor 還提供了三個方法:

  • isOpen():用於在取數據之前判斷 Cursor 對象是否是打開狀態。只有當打開時 Cursor 才能取數據;

  • isConsumed():用於判斷查詢結果是否全部取完。

  • getCurrentIndex():返回已經獲取了多少條數據

因爲 Cursor 實現了迭代器接口,因此在實際使用當中,從 Cursor 取數據非常簡單:

cursor.forEach(rowObject -> {...});

但構建 Cursor 的過程不簡單

我們舉個實際例子。下面是一個 Mapper 類:

@Mapper
public interface FooMapper {
    @Select("select * from foo limit #{limit}")
    Cursor<Foo> scan(@Param("limit") int limit);
}

方法 scan() 是一個非常簡單的查詢。通過指定 Mapper 方法的返回值爲 Cursor 類型,MyBatis 就知道這個查詢方法一個流式查詢。

然後我們再寫一個 SpringMVC Controller 方法來調用 Mapper(無關的代碼已經省略):

@GetMapping("foo/scan/0/{limit}")
public void scanFoo0(@PathVariable("limit") int limit) throws Exception {
    try (Cursor<Foo> cursor = fooMapper.scan(limit)) {  // 1
        cursor.forEach(foo -> {});                      // 2
    }
}

上面的代碼中,fooMapper 是 @Autowired 進來的。註釋 1 處調用 scan 方法,得到 Cursor 對象並保證它能最後關閉;2 處則是從 cursor 中取數據。

上面的代碼看上去沒什麼問題,但是執行 scanFoo0() 時會報錯:

java.lang.IllegalStateException: A Cursor is already closed.

這是因爲我們前面說了在取數據的過程中需要保持數據庫連接,而 Mapper 方法通常在執行完後連接就關閉了,因此 Cusor 也一併關閉了。

所以,解決這個問題的思路不復雜,保持數據庫連接打開即可。我們至少有三種方案可選。

方案一:SqlSessionFactory

我們可以用 SqlSessionFactory 來手工打開數據庫連接,將 Controller 方法修改如下:

@GetMapping("foo/scan/1/{limit}")
public void scanFoo1(@PathVariable("limit") int limit) throws Exception {
    try (
        SqlSession sqlSession = sqlSessionFactory.openSession();  // 1
        Cursor<Foo> cursor = 
              sqlSession.getMapper(FooMapper.class).scan(limit)   // 2
    ) {
        cursor.forEach(foo -> { });
    }
}

上面的代碼中,1 處我們開啓了一個 SqlSession (實際上也代表了一個數據庫連接),並保證它最後能關閉;2 處我們使用 SqlSession 來獲得 Mapper 對象。這樣才能保證得到的 Cursor 對象是打開狀態的。

方案二:TransactionTemplate

在 Spring 中,我們可以用 TransactionTemplate 來執行一個數據庫事務,這個過程中數據庫連接同樣是打開的。代碼如下:

@GetMapping("foo/scan/2/{limit}")
public void scanFoo2(@PathVariable("limit") int limit) throws Exception {
    TransactionTemplate transactionTemplate = 
            new TransactionTemplate(transactionManager);  // 1

    transactionTemplate.execute(status -> {               // 2
        try (Cursor<Foo> cursor = fooMapper.scan(limit)) {
            cursor.forEach(foo -> { });
        } catch (IOException e) {
            e.printStackTrace();
        }
        return null;
    });
}

上面的代碼中,1 處我們創建了一個 TransactionTemplate 對象(此處 transactionManager 是怎麼來的不用多解釋,本文假設讀者對 Spring 數據庫事務的使用比較熟悉了),2 處執行數據庫事務,而數據庫事務的內容則是調用 Mapper 對象的流式查詢。注意這裏的 Mapper 對象無需通過 SqlSession 創建。

方案三:@Transactional 註解

這個本質上和方案二一樣,代碼如下:

@GetMapping("foo/scan/3/{limit}")
@Transactional
public void scanFoo3(@PathVariable("limit") int limit) throws Exception {
    try (Cursor<Foo> cursor = fooMapper.scan(limit)) {
        cursor.forEach(foo -> { });
    }
}

它僅僅是在原來方法上面加了個 @Transactional 註解。這個方案看上去最簡潔,但請注意 Spring 框架當中註解使用的坑:只在外部調用時生效。在當前類中調用這個方法,依舊會報錯。

以上是三種實現 MyBatis 流式查詢的方法。

作者 | 捏造的信仰

來源 | https://segmentfault.com/a/1190000022478915

程序員專欄 掃碼關注填加客服 長按識別下方二維碼進羣


近期精彩內容推薦:  

 又一個程序員,被抓捕!(真實事件)

 程序員有個可愛女朋友是種什麼體驗?

 “12306”的架構到底有多牛逼?

 csv文件讀寫亂碼問題的一個簡單解決方法


在看點這裏好文分享給更多人↓↓

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章