0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

MyBatis Plus解決大數(shù)據(jù)量查詢慢問題

jf_ro2CN3Fa ? 來源:CSDN ? 2023-01-16 10:17 ? 次閱讀

  • 常規(guī)查詢
  • 流式查詢
  • 游標(biāo)查詢

大數(shù)據(jù)量操作的場(chǎng)景大致如下:

  • 數(shù)據(jù)遷移
  • 數(shù)據(jù)導(dǎo)出
  • 批量處理數(shù)據(jù)

在實(shí)際工作中當(dāng)指定查詢數(shù)據(jù)過大時(shí),我們一般使用分頁查詢的方式一頁一頁的將數(shù)據(jù)放到內(nèi)存處理。但有些情況不需要分頁的方式查詢數(shù)據(jù)或分很大一頁查詢數(shù)據(jù)時(shí),如果一下子將數(shù)據(jù)全部加載出來到內(nèi)存中,很可能會(huì)發(fā)生OOM(內(nèi)存溢出);而且查詢會(huì)很慢,因?yàn)榭蚣芎馁M(fèi)大量的時(shí)間和內(nèi)存去把數(shù)據(jù)庫查詢的結(jié)果封裝成我們想要的對(duì)象(實(shí)體類)。

舉例:在業(yè)務(wù)系統(tǒng)需要從 MySQL 數(shù)據(jù)庫里讀取 100w 數(shù)據(jù)行進(jìn)行處理,應(yīng)該怎么做?

做法通常如下:

  • 常規(guī)查詢: 一次性讀取 100w 數(shù)據(jù)到 JVM 內(nèi)存中,或者分頁讀取
  • 流式查詢: 建立長連接,利用服務(wù)端游標(biāo),每次讀取一條加載到 JVM 內(nèi)存(多次獲取,一次一行)
  • 游標(biāo)查詢: 和流式一樣,通過 fetchSize 參數(shù),控制一次讀取多少條數(shù)據(jù)(多次獲取,一次多行)

常規(guī)查詢

默認(rèn)情況下,完整的檢索結(jié)果集會(huì)將其存儲(chǔ)在內(nèi)存中。在大多數(shù)情況下,這是最有效的操作方式,并且由于 MySQL 網(wǎng)絡(luò)協(xié)議的設(shè)計(jì),因此更易于實(shí)現(xiàn)。

舉例:

假設(shè)單表 100w 數(shù)據(jù)量,一般會(huì)采用分頁的方式查詢:

@Mapper
publicinterfaceBigDataSearchMapperextendsBaseMapper<BigDataSearchEntity>{

@Select("SELECTbds.*FROMbig_data_searchbds${ew.customSqlSegment}")
PagepageList(@Param("page")Pagepage,@Param(Constants.WRAPPER)QueryWrapperqueryWrapper);

}

注:該示例使用的 MybatisPlus

該方式比較簡單,如果在不考慮 LIMIT 深分頁優(yōu)化情況下,估計(jì)你的數(shù)據(jù)庫服務(wù)器就噶皮了,或者你能等上幾十分鐘或幾小時(shí),甚至幾天時(shí)間檢索數(shù)據(jù)

基于 Spring Boot + MyBatis Plus + Vue & Element 實(shí)現(xiàn)的后臺(tái)管理系統(tǒng) + 用戶小程序,支持 RBAC 動(dòng)態(tài)權(quán)限、多租戶、數(shù)據(jù)權(quán)限、工作流、三方登錄、支付、短信、商城等功能

  • 項(xiàng)目地址:https://github.com/YunaiV/ruoyi-vue-pro
  • 視頻教程:https://doc.iocoder.cn/video/

流式查詢

流式查詢指的是查詢成功后不是返回一個(gè)集合而是返回一個(gè)迭代器,應(yīng)用每次從迭代器取一條查詢結(jié)果。流式查詢的好處是能夠降低內(nèi)存使用。

如果沒有流式查詢,我們想要從數(shù)據(jù)庫取 100w 條記錄而又沒有足夠的內(nèi)存時(shí),就不得不分頁查詢,而分頁查詢效率取決于表設(shè)計(jì),如果設(shè)計(jì)的不好,就無法執(zhí)行高效的分頁查詢。因此流式查詢是一個(gè)數(shù)據(jù)庫訪問框架必須具備的功能。

MyBatis 中使用流式查詢避免數(shù)據(jù)量過大導(dǎo)致 OOM ,但在流式查詢的過程當(dāng)中,數(shù)據(jù)庫連接是保持打開狀態(tài)的,因此要注意的是:

  • 執(zhí)行一個(gè)流式查詢后,數(shù)據(jù)庫訪問框架就不負(fù)責(zé)關(guān)閉數(shù)據(jù)庫連接了,需要應(yīng)用在取完數(shù)據(jù)后自己關(guān)閉。
  • 必須先讀?。ɑ蜿P(guān)閉)結(jié)果集中的所有行,然后才能對(duì)連接發(fā)出任何其他查詢,否則將引發(fā)異常。
MyBatis 流式查詢接口

MyBatis 提供了一個(gè)叫 org.apache.ibatis.cursor.Cursor 的接口類用于流式查詢,這個(gè)接口繼承了 java.io.Closeablejava.lang.Iterable 接口,由此可知:

  • Cursor 是可關(guān)閉的;
  • Cursor 是可遍歷的。

除此之外,Cursor 還提供了三個(gè)方法:

  • isOpen(): 用于在取數(shù)據(jù)之前判斷 Cursor 對(duì)象是否是打開狀態(tài)。只有當(dāng)打開時(shí) Cursor 才能取數(shù)據(jù);
  • isConsumed(): 用于判斷查詢結(jié)果是否全部取完。
  • getCurrentIndex(): 返回已經(jīng)獲取了多少條數(shù)據(jù)

使用流式查詢,則要保持對(duì)產(chǎn)生結(jié)果集的語句所引用的表的并發(fā)訪問,因?yàn)槠?查詢會(huì)獨(dú)占連接,所以必須盡快處理

為什么要用流式查詢?

如果有一個(gè)很大的查詢結(jié)果需要遍歷處理,又不想一次性將結(jié)果集裝入客戶端內(nèi)存,就可以考慮使用流式查詢;

分庫分表場(chǎng)景下,單個(gè)表的查詢結(jié)果集雖然不大,但如果某個(gè)查詢跨了多個(gè)庫多個(gè)表,又要做結(jié)果集的合并、排序等動(dòng)作,依然有可能撐爆內(nèi)存;詳細(xì)研究了sharding-sphere的代碼不難發(fā)現(xiàn),除了group byorder by字段不一樣之外,其他的場(chǎng)景都非常適合使用流式查詢,可以最大限度的降低對(duì)客戶端內(nèi)存的消耗。

基于 Spring Cloud Alibaba + Gateway + Nacos + RocketMQ + Vue & Element 實(shí)現(xiàn)的后臺(tái)管理系統(tǒng) + 用戶小程序,支持 RBAC 動(dòng)態(tài)權(quán)限、多租戶、數(shù)據(jù)權(quán)限、工作流、三方登錄、支付、短信、商城等功能

  • 項(xiàng)目地址:https://github.com/YunaiV/yudao-cloud
  • 視頻教程:https://doc.iocoder.cn/video/

游標(biāo)查詢

對(duì)大量數(shù)據(jù)進(jìn)行處理時(shí),為防止內(nèi)存泄漏情況發(fā)生,也可以采用游標(biāo)方式進(jìn)行數(shù)據(jù)查詢處理。這種處理方式比常規(guī)查詢要快很多。

當(dāng)查詢百萬級(jí)的數(shù)據(jù)的時(shí)候,還可以使用游標(biāo)方式進(jìn)行數(shù)據(jù)查詢處理,不僅可以節(jié)省內(nèi)存的消耗,而且還不需要一次性取出所有數(shù)據(jù),可以進(jìn)行逐條處理或逐條取出部分批量處理。一次查詢指定 fetchSize 的數(shù)據(jù),直到把數(shù)據(jù)全部處理完。

Mybatis 的處理加了兩個(gè)注解:@Options@ResultType

@Mapper
publicinterfaceBigDataSearchMapperextendsBaseMapper<BigDataSearchEntity>{

//方式一多次獲取,一次多行
@Select("SELECTbds.*FROMbig_data_searchbds${ew.customSqlSegment}")
@Options(resultSetType=ResultSetType.FORWARD_ONLY,fetchSize=1000000)
PagepageList(@Param("page")Pagepage,@Param(Constants.WRAPPER)QueryWrapperqueryWrapper);

//方式二一次獲取,一次一行
@Select("SELECTbds.*FROMbig_data_searchbds${ew.customSqlSegment}")
@Options(resultSetType=ResultSetType.FORWARD_ONLY,fetchSize=100000)
@ResultType(BigDataSearchEntity.class)
voidlistData(@Param(Constants.WRAPPER)QueryWrapper<BigDataSearchEntity>queryWrapper,ResultHandler<BigDataSearchEntity>handler);

}

@Options

  • ResultSet.FORWORD_ONLY:結(jié)果集的游標(biāo)只能向下滾動(dòng)
  • ResultSet.SCROLL_INSENSITIVE:結(jié)果集的游標(biāo)可以上下移動(dòng),當(dāng)數(shù)據(jù)庫變化時(shí),當(dāng)前結(jié)果集不變
  • ResultSet.SCROLL_SENSITIVE:返回可滾動(dòng)的結(jié)果集,當(dāng)數(shù)據(jù)庫變化時(shí),當(dāng)前結(jié)果集同步改變
  • fetchSize:每次獲取量

@ResultType

  • @ResultType(BigDataSearchEntity.class):轉(zhuǎn)換成返回實(shí)體類型

注意:返回類型必須為 void ,因?yàn)椴樵兊慕Y(jié)果在 ResultHandler 里處理數(shù)據(jù),所以這個(gè) hander 也是必須的,可以使用 lambda 實(shí)現(xiàn)一個(gè)依次處理邏輯。

注意:

雖然上面的代碼中都有 @Options 但實(shí)際操作卻有不同:

  • 方式一是多次查詢,一次返回多條;
  • 方式二是一次查詢,一次返回一條;

原因:

Oracle 是從服務(wù)器一次取出 fetch size 條記錄放在客戶端,客戶端處理完成一個(gè)批次后再向服務(wù)器取下一個(gè)批次,直到所有數(shù)據(jù)處理完成。

MySQL 是在執(zhí)行 ResultSet.next() 方法時(shí),會(huì)通過數(shù)據(jù)庫連接一條一條的返回。flush buffer 的過程是阻塞式的,如果網(wǎng)絡(luò)中發(fā)生了擁塞,send buffer 被填滿,會(huì)導(dǎo)致 buffer 一直 flush 不出去,那 MySQL 的處理線程會(huì)阻塞,從而避免數(shù)據(jù)把客戶端內(nèi)存撐爆。

非流式查詢和流式查詢區(qū)別:

  • 非流式查詢:內(nèi)存會(huì)隨著查詢記錄的增長而近乎直線增長。
  • 流式查詢:內(nèi)存會(huì)保持穩(wěn)定,不會(huì)隨著記錄的增長而增長。其內(nèi)存大小取決于批處理大小BATCH_SIZE的設(shè)置,該尺寸越大,內(nèi)存會(huì)越大。所以BATCH_SIZE應(yīng)該根據(jù)業(yè)務(wù)情況設(shè)置合適的大小。

另外要切記每次處理完一批結(jié)果要記得釋放存儲(chǔ)每批數(shù)據(jù)的臨時(shí)容器,即上文中的gxids.clear();

審核編輯 :李倩


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)庫
    +關(guān)注

    關(guān)注

    7

    文章

    3752

    瀏覽量

    64233
  • MySQL
    +關(guān)注

    關(guān)注

    1

    文章

    798

    瀏覽量

    26399
  • 數(shù)據(jù)遷移
    +關(guān)注

    關(guān)注

    0

    文章

    67

    瀏覽量

    6932

原文標(biāo)題:MyBatis Plus 解決大數(shù)據(jù)量查詢慢問題

文章出處:【微信號(hào):芋道源碼,微信公眾號(hào):芋道源碼】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    大數(shù)據(jù)從業(yè)者必知必會(huì)的Hive SQL調(diào)優(yōu)技巧

    大數(shù)據(jù)從業(yè)者必知必會(huì)的Hive SQL調(diào)優(yōu)技巧 摘要 :在大數(shù)據(jù)領(lǐng)域中,Hive SQL被廣泛應(yīng)用于數(shù)據(jù)倉庫的數(shù)據(jù)查詢和分析。然而,由于數(shù)據(jù)量
    的頭像 發(fā)表于 09-24 13:30 ?150次閱讀

    使用mybatis切片實(shí)現(xiàn)數(shù)據(jù)權(quán)限控制

    一、使用方式 數(shù)據(jù)權(quán)限控制需要對(duì)查詢出的數(shù)據(jù)進(jìn)行篩選,對(duì)業(yè)務(wù)入侵最少的方式就是利用mybatis或者數(shù)據(jù)庫連接池的切片對(duì)已有業(yè)務(wù)的sql進(jìn)行
    的頭像 發(fā)表于 07-09 17:26 ?316次閱讀
    使用<b class='flag-5'>mybatis</b>切片實(shí)現(xiàn)<b class='flag-5'>數(shù)據(jù)</b>權(quán)限控制

    CC2640R2F BLE如何實(shí)現(xiàn)一次連接事件傳輸?shù)?b class='flag-5'>數(shù)據(jù)量為500字節(jié),或者更大?

    您好,我想實(shí)現(xiàn)一次連接事件傳輸?shù)?b class='flag-5'>數(shù)據(jù)量為500字節(jié),或者更大。是如何實(shí)現(xiàn)的? MTU設(shè)置成255,應(yīng)該是可以傳輸251字節(jié)數(shù)據(jù)。MAX_NUM_PDU設(shè)置成5,應(yīng)該可以傳送251*5=1255字節(jié)吧?目前傳輸超過251字節(jié)的數(shù)據(jù)
    發(fā)表于 05-30 06:12

    藍(lán)牙Mesh模塊多跳大數(shù)據(jù)量高帶寬傳輸數(shù)據(jù)方法

    通過多個(gè)跳數(shù)進(jìn)行通信,從而實(shí)現(xiàn)大范圍的覆蓋。然而,隨著數(shù)據(jù)量的增加和帶寬需求的提高,如何在藍(lán)牙Mesh網(wǎng)絡(luò)中實(shí)現(xiàn)高效、穩(wěn)定的多跳大數(shù)據(jù)量高帶寬傳輸數(shù)據(jù)成為了一個(gè)亟待解決的問題。本文將介紹一種基于藍(lán)牙Mesh模塊的多跳
    的頭像 發(fā)表于 05-28 11:23 ?627次閱讀
    藍(lán)牙Mesh模塊多跳<b class='flag-5'>大數(shù)據(jù)量</b>高帶寬傳輸<b class='flag-5'>數(shù)據(jù)</b>方法

    大數(shù)據(jù)技術(shù)是干嘛的 大數(shù)據(jù)核心技術(shù)有哪些

    的核心技術(shù),包括數(shù)據(jù)采集、存儲(chǔ)與管理、處理與分析等方面。 一、大數(shù)據(jù)技術(shù)背景和概念 1.1 背景 隨著互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,人們可以通過各種途徑產(chǎn)生、獲取和傳輸數(shù)據(jù),使數(shù)據(jù)量呈現(xiàn)爆炸式
    的頭像 發(fā)表于 01-31 11:07 ?2981次閱讀

    串口中斷函數(shù)中,接收的數(shù)據(jù)量已經(jīng)超過了FIFO的長度,會(huì)不會(huì)造成數(shù)據(jù)丟失呀?

    如果在串口中斷函數(shù)中,正在讀緩沖區(qū)的中的數(shù)據(jù)(還沒有讀完),這個(gè)時(shí)候,串口又接收到新的數(shù)據(jù),接收的數(shù)據(jù)量已經(jīng)超過了FIFO的長度,會(huì)不會(huì)造成數(shù)據(jù)丟失呀
    發(fā)表于 01-17 08:14

    mybatis邏輯分頁和物理分頁的區(qū)別

    這兩種分頁方式的區(qū)別。 邏輯分頁是在數(shù)據(jù)庫中執(zhí)行查詢時(shí)使用的一種分頁方式。這種方式是通過在查詢語句中添加LIMIT或OFFSET關(guān)鍵字來限制結(jié)果集的大小和偏移來實(shí)現(xiàn)的。常見的邏輯分頁
    的頭像 發(fā)表于 12-03 14:54 ?827次閱讀

    mybatis框架的主要作用

    MyBatis框架的主要作用包括以下幾個(gè)方面。 數(shù)據(jù)庫操作的簡化和標(biāo)準(zhǔn)化: MyBatis框架提供了一種簡單的方式來執(zhí)行數(shù)據(jù)庫操作,包括插入、更新、刪除和
    的頭像 發(fā)表于 12-03 14:49 ?1938次閱讀

    mybatis一級(jí)緩存和二級(jí)緩存的原理

    SqlSession的生命周期中,當(dāng)SqlSession關(guān)閉時(shí),一級(jí)緩存也會(huì)被清空。 1.2 緩存實(shí)現(xiàn)機(jī)制 一級(jí)緩存采用了基于PerpetualCache的HashMap來實(shí)現(xiàn),使用一個(gè)Map對(duì)象來保存緩存的數(shù)據(jù)。當(dāng)執(zhí)行相同的查詢時(shí),M
    的頭像 發(fā)表于 12-03 11:55 ?1056次閱讀

    mybatis和mybatisplus的區(qū)別

    個(gè)輕量級(jí)的持久層框架,它提供了一個(gè)靈活的SQL映射機(jī)制,使得開發(fā)者可以編寫原生SQL語句來操作數(shù)據(jù)庫。MyBatis的設(shè)計(jì)目標(biāo)是將原生SQL和對(duì)象關(guān)系映射(ORM)相結(jié)合,以便開發(fā)者可以靈活地操作數(shù)據(jù)庫。 而
    的頭像 發(fā)表于 12-03 11:53 ?2453次閱讀

    mybatis接口動(dòng)態(tài)代理原理

    MyBatis是一款輕量級(jí)的Java持久化框架,它通過XML或注解配置的方式,將數(shù)據(jù)庫操作與SQL語句解耦,提供了一種簡單、靈活的數(shù)據(jù)訪問方式。在MyBatis中,使用動(dòng)態(tài)代理技術(shù)來實(shí)
    的頭像 發(fā)表于 12-03 11:52 ?880次閱讀

    mybatis的dao能重載嗎

    MyBatis的DAO能否重載? 在MyBatis中,DAO是數(shù)據(jù)訪問對(duì)象的縮寫,用于執(zhí)行與數(shù)據(jù)庫交互的操作。MyBatis的DAO可以重載
    的頭像 發(fā)表于 12-03 11:51 ?1223次閱讀

    java數(shù)據(jù)量大了怎么處理

    當(dāng)Java應(yīng)用程序處理大數(shù)據(jù)量時(shí),需要采取一些技術(shù)和策略來優(yōu)化性能和提高可擴(kuò)展性。在本文中,我將詳細(xì)介紹一些常見的處理大數(shù)據(jù)量的方法和建議。 一、數(shù)據(jù)結(jié)構(gòu)和算法優(yōu)化 1.使用合適的數(shù)據(jù)
    的頭像 發(fā)表于 11-23 14:43 ?3322次閱讀

    mysql中的數(shù)據(jù)大于千萬怎么辦

    等方面。 一、硬件方面的優(yōu)化 增加服務(wù)器的內(nèi)存容量:大量數(shù)據(jù)的讀寫操作需要較大的內(nèi)存空間進(jìn)行緩存,以提高性能。建議將服務(wù)器的內(nèi)存升級(jí)到足夠的容量,以適應(yīng)大數(shù)據(jù)量的操作。 使用SSD硬盤:傳統(tǒng)的機(jī)械硬盤在大數(shù)據(jù)量下的讀寫
    的頭像 發(fā)表于 11-23 14:41 ?1495次閱讀

    多線程并發(fā)查詢oracle數(shù)據(jù)

    數(shù)據(jù)庫的原理、使用場(chǎng)景、實(shí)現(xiàn)方法以及可能遇到的問題和解決方案。 一、多線程并發(fā)查詢的原理 在傳統(tǒng)的單線程查詢方式中,當(dāng)一個(gè)查詢請(qǐng)求發(fā)起時(shí),數(shù)據(jù)
    的頭像 發(fā)表于 11-17 14:22 ?3557次閱讀