0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于InnoDB的內(nèi)存結(jié)構(gòu)及原理詳解

jf_f8pIz0xS ? 來源:SH的全棧筆記 ? 作者:SH的全棧筆記 ? 2021-04-16 16:15 ? 次閱讀

之前寫過一篇文章「簡單了解InnoDB原理」,現(xiàn)在回過頭看,其實里面只是把緩沖池(Buffer Pool),重做日志緩沖(Redo Log Buffer)、插入緩沖(Insert Buffer)和自適應(yīng)哈希索引Adaptive Hash Index)等概念簡單的介紹了一下。

除此之外還聊了一下MySQL和InnoDB的日志,和兩次寫,總的來說算是一個入門級別的介紹,這篇文章就來詳細(xì)介紹一下InnoDB的內(nèi)存結(jié)構(gòu)。

InnoDB內(nèi)存結(jié)構(gòu)

其大致結(jié)構(gòu)如下圖。

InnoDB內(nèi)存的兩個主要區(qū)域分別為Buffer Pool和Log Buffer,此處的Log Buffer目前是用于緩存Redo Log。而Buffer Pool則是MySQL或者說InnoDB中,十分重要、核心的一部分,位于主存。這也是為什么其訪問數(shù)據(jù)的效率高,你可以暫時把它理解成Redis那樣的內(nèi)存數(shù)據(jù)庫,因為我們更新和新增當(dāng)然它不是,只是這樣會更加方便我們理解。

Buffer Pool

通常來說,宿主機80%的內(nèi)存都應(yīng)該分配給Buffer Pool,因為Buffer Pool越大,其能緩存的數(shù)據(jù)就更多,更多的操作都會發(fā)生在內(nèi)存,從而達(dá)到提升效率的目的。

由于其存儲的數(shù)據(jù)類型和數(shù)據(jù)量非常多,Buffer Pool存儲的時候一定會按照某些結(jié)構(gòu)去存儲,并且做了某些處理。否則獲取的時候除了遍歷所有數(shù)據(jù)之外,沒有其他的捷徑,這樣的低效率操作肯定是無法支撐MySQL的高性能的。

因此,Buffer Pool被分成了很多頁,這在之前的文章中也有講過,這里不再贅述。每頁可以存放很多數(shù)據(jù),剛剛也提到了,InnoDB一定是對數(shù)據(jù)做了某些操作。

InnoDB使用了鏈表來組織頁和頁中存儲的數(shù)據(jù),頁與頁之間形成了雙向鏈表,這樣可以方便的從當(dāng)前頁跳到下一頁,同時使用LRU(Least Recently Used)算法去淘汰那些不經(jīng)常使用的數(shù)據(jù)。

同時,每頁中的數(shù)據(jù)也通過單向鏈表進(jìn)行鏈接。因為這些數(shù)據(jù)是分散到Buffer Pool中的,單向鏈表將這些分散的內(nèi)存給連接了起來。

Log Buffer

Log Buffer用來存儲那些即將被刷入到磁盤文件中的日志,例如Redo Log,該區(qū)域也是InnoDB內(nèi)存的重要組成部分。Log Buffer的默認(rèn)值為16M,如果我們需要進(jìn)行調(diào)整的話,可以通過配置參數(shù)innodb_log_buffer_size來進(jìn)行調(diào)整。

當(dāng)Log Buffer如果較大,就可以存儲更多的Redo Log,這樣一來在事務(wù)提交之前我們就不需要將Redo Log刷入磁盤,只需要丟到Log Buffer中去即可。因此較大的Log Buffer就可以更好的支持較大的事務(wù)運行;同理,如果有事務(wù)會大量的更新、插入或者刪除行,那么適當(dāng)?shù)脑龃驦og Buffer的大小,也可以有效的減少部分磁盤I/O操作。

至于Log Buffer中的數(shù)據(jù)刷入到磁盤的頻率,則可以通過參數(shù)innodb_flush_log_at_trx_commit來決定。

Buffer Pool的LRU算法

了解完了InnoDB的內(nèi)存結(jié)構(gòu)之后,我們來仔細(xì)看看Buffer Pool的LRU算法是如何實現(xiàn)將最近沒有使用過的數(shù)據(jù)給過期的。

原生LRU

首先明確一點,此處的LRU算法和我們傳統(tǒng)的LRU算法有一定的區(qū)別。為什么呢?因為實際生產(chǎn)環(huán)境中會存在全表掃描的情況,如果數(shù)據(jù)量較大,可能會將Buffer Pool中存下來的熱點數(shù)據(jù)給全部替換出去,而這樣就會導(dǎo)致該段時間MySQL性能斷崖式下跌。

對于這種情況,MySQL有一個專用名詞叫緩沖池污染。所以MySQL對LRU算法做了優(yōu)化。

優(yōu)化后的LRU

優(yōu)化之后的鏈表被分成了兩個部分,分別是 New Sublist 和 Old Sublist,其分別占用了 Buffer Pool 的3/4和1/4。

鏈表的前3/4,也就是 New Sublist 存放的是訪問較為頻繁的頁,而后1/4也就是 Old Sublist 則是反問的不那么頻繁的頁。Old Sublist中的數(shù)據(jù),會在后續(xù)Buffer Pool剩余空間不足、或者有新的頁加入時被移除掉。

了解了鏈表的整體構(gòu)造和組成之后,我們就以新頁被加入到鏈表為起點,把整體流程走一遍。首先,一個新頁被放入到Buffer Pool之后,會被插入到鏈表中 New Sublist 和 Old Sublist 相交的位置,該位置叫MidPoint。

該鏈表存儲的數(shù)據(jù)來源有兩部分,分別是:

MySQL的預(yù)讀線程預(yù)先加載的數(shù)據(jù)

用戶的操作,例如Query查詢

默認(rèn)情況下,由用戶操作影響而進(jìn)入到Buffer Pool中的數(shù)據(jù),會被立即放到鏈表的最前端,也就是 New Sublist 的 Head 部分。但如果是MySQL啟動時預(yù)加載的數(shù)據(jù),則會放入MidPoint中,如果這部分?jǐn)?shù)據(jù)被用戶訪問過之后,才會放到鏈表的最前端。

這樣一來,雖然這些頁數(shù)據(jù)在鏈表中了,但是由于沒有被訪問過,就會被移動到后1/4的 Old Sublist中去,直到被清理掉。

優(yōu)化Buffer Pool的配置

在實際的生產(chǎn)環(huán)境中,我們可以通過變更某些設(shè)置,來提升Buffer Pool運行的性能。

例如,我們可以分配盡量多的內(nèi)存給Buffer Pool,如此就可以緩存更多的數(shù)據(jù)在內(nèi)存中

當(dāng)前有足夠的內(nèi)存時,就可以搞多個Buffer Pool實例,減少并發(fā)操作所帶來的數(shù)據(jù)競爭

當(dāng)我們可以預(yù)測到即將到來的大量請求時,我們可以手動的執(zhí)行這部分?jǐn)?shù)據(jù)的預(yù)讀請求

我們還可以控制Buffer Pool刷數(shù)據(jù)到磁盤的頻率,以根據(jù)當(dāng)前MySQL的負(fù)載動態(tài)調(diào)整

那我們怎么知道當(dāng)前運行的 MySQL 中 Buffer Pool 的狀態(tài)呢?我們可以通過命令show engine innodb status來查看。這個命令是看 InnoDB 整體的狀態(tài)的, Buffer Pool 相關(guān)的監(jiān)控指標(biāo)包含在了其中,在Buffer Pool And Memory模塊中。

樣例如下。

---------------------- BUFFER POOL AND MEMORY ---------------------- Total large memory allocated 137428992 Dictionary memory allocated 972752 Buffer pool size 8191 Free buffers 4596 Database pages 3585 Old database pages 1303 Modified db pages 0 Pending reads 0 Pending writes: LRU 0, flush list 0, single page 0 Pages made young 1171, not young 0 0.00 youngs/s, 0.00 non-youngs/s Pages read 655, created 7139, written 173255 0.00 reads/s, 0.00 creates/s, 0.00 writes/s No buffer pool page gets since the last printout Pages read ahead 0.00/s, evicted without access 0.00/s, Random read ahead 0.00/s LRU len: 3585, unzip_LRU len: 0 I/O sum[0]:cur[0], unzip sum[0]:cur[0]

解釋一些關(guān)鍵的指標(biāo)所代表的含義:

Total memory allocated:分配給 Buffer Pool 的總內(nèi)存

Dictionary memory allocated:分配給 InnoDB 數(shù)據(jù)字典的總內(nèi)存

Buffer pool size:分配給 Buffer Pool 中頁的內(nèi)存大小

Free buffers:分配給 Buffer Pool 中 Free List 的內(nèi)存大小

Database pages:分配給 LRU 鏈表的內(nèi)存大小

Old database pages:分配給 LRU 子鏈表的內(nèi)存大小

Modified db pages:當(dāng)前Buffer Pook中被更新的頁的數(shù)量

Pending reads:當(dāng)前等待讀入 Buffer Pool 的頁的數(shù)量

Pending writes LRU:當(dāng)前在 LRU 鏈表中等待被刷入磁盤的臟頁數(shù)量

都是些很常規(guī)的配置項,你可能會比較好奇什么是 Free List。

Free List 中存放的都是未被使用的頁。因為MySQL啟動的時候,InnoDB 會預(yù)先申請一部分頁。如果當(dāng)前頁還未被使用,就會被保存在 Free List 中。

知道了 Free List,那么你也應(yīng)該知道 Flush List,里面保存的是所有的臟頁,都是被更改后需要刷入到磁盤的。

自適應(yīng)哈希索引

自適應(yīng)哈希索引(Adaptive Hash Index)是配合Buffer Pool工作的一個功能。自適應(yīng)哈希索引使得MySQL的性能更加接近于內(nèi)存服務(wù)器。

如果要啟用自適應(yīng)哈希索引,可以通過更改配置innodb_adaptive_hash_index來開啟。如果不想啟用,也可以在啟動的時候,通過命令行參數(shù)--skip-innodb-adaptive-hash-index來關(guān)閉。

自適應(yīng)哈希索引是根據(jù)索引Key的前綴來構(gòu)建的,InnoDB 有自己的監(jiān)控索引的機制,當(dāng)其檢測到為當(dāng)前某個索引頁建立哈希索引能夠提升效率時,就會創(chuàng)建對應(yīng)的哈希索引。如果某張表數(shù)據(jù)量很少,其數(shù)據(jù)全部都在Buffer Pool中,那么此時自適應(yīng)哈希索引就會變成我們所熟悉的指針這樣一個角色。

當(dāng)然,創(chuàng)建、維護自適應(yīng)哈希索引是會帶來一定的開銷的,但是比起其帶來的性能上的提升,這點開銷可以直接忽略不計。但是,是否要開啟自適應(yīng)哈希索引還是需要看具體的業(yè)務(wù)情況的,例如當(dāng)我們的業(yè)務(wù)特征是有大量的并發(fā)Join查詢,此時訪問自適應(yīng)哈希索引被產(chǎn)生競爭。并且如果業(yè)務(wù)還使用了LIKE或者%等通配符,根本就不會用到哈希索引,那么此時自適應(yīng)哈希索引反而變成了系統(tǒng)的負(fù)擔(dān)。

所以,為了盡可能的減少并發(fā)情況下帶來的競爭,InnoDB對自適應(yīng)哈希索引進(jìn)行了分區(qū),每個索引都被綁定到了一個特定的分區(qū),而每個分區(qū)都由單獨的鎖進(jìn)行保護。其實通俗點理解,就是降低了鎖的粒度。分區(qū)的數(shù)量我們可以通過配置innodb_adaptive_hash_index_parts來改變,其可配置的區(qū)間范圍為[8, 512]。

Change Buffer

聊完了 Buffer Pool 中索引相關(guān),剩下的就是 Change Buffer 了。Change Buffer是一塊比較特殊的區(qū)域,其作用是用于存儲那些當(dāng)前不在 Buffer Pool 中的但是又被修改過的二級索引。

用流程來描述一下就是,當(dāng)我們更新了非聚簇索引(二級索引)的數(shù)據(jù)時,此時應(yīng)該是直接將其在Buffer Pool中的對應(yīng)數(shù)據(jù)更新了即可,但是不湊巧的是,當(dāng)前二級索引不在 Buffer Pool 中,此時將其從磁盤拉取到 Buffer Pool 中的話,并不是最優(yōu)的解,因為該二級索引可能之后根本就不會被用到,那么剛剛昂貴的磁盤I/O操作就白費了。

所以,我們需要這么一個地方,來暫存對這些二級索引所做的改動。當(dāng)被緩存的二級索引頁被其他的請求加載到了Buffer Pool 中之后,就會將 Change Buffer 中緩存的數(shù)據(jù)合并到 Buffer Pool 中去。

當(dāng)然,Change Buffer也不是沒有缺點。當(dāng) Change Buffer 中有很多的數(shù)據(jù)時,全部合并到Buffer Pool可能會花上幾個小時的時間,并且在合并的期間,磁盤的I/O操作會比較頻繁,從而導(dǎo)致部分的CPU資源被占用。

那你可能會問,難道只有被緩存的頁加載到了 Buffer Pool 才會觸發(fā)合并操作嗎?那要是它一直沒有被加載進(jìn)來,Change Buffer 不就被撐爆了?很顯然,InnoDB在設(shè)計的時候考慮到了這個點。除了對應(yīng)的頁加載,提交事務(wù)、服務(wù)停機、服務(wù)重啟都會觸發(fā)合并。
編輯:lyn

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 內(nèi)存
    +關(guān)注

    關(guān)注

    8

    文章

    2903

    瀏覽量

    73539
  • MySQL
    +關(guān)注

    關(guān)注

    1

    文章

    789

    瀏覽量

    26283
  • 索引
    +關(guān)注

    關(guān)注

    0

    文章

    59

    瀏覽量

    10446
收藏 人收藏

    評論

    相關(guān)推薦

    內(nèi)存緩沖區(qū)和內(nèi)存的關(guān)系

    內(nèi)存緩沖區(qū)和內(nèi)存之間的關(guān)系是計算機體系結(jié)構(gòu)中一個至關(guān)重要的方面,它們共同協(xié)作以提高數(shù)據(jù)處理的效率和系統(tǒng)的整體性能。
    的頭像 發(fā)表于 09-10 14:38 ?146次閱讀

    內(nèi)存管理的硬件結(jié)構(gòu)

    常見的內(nèi)存分配函數(shù)有malloc,mmap等,但大家有沒有想過,這些函數(shù)在內(nèi)核中是怎么實現(xiàn)的?換句話說,Linux內(nèi)核的內(nèi)存管理是怎么實現(xiàn)的?
    的頭像 發(fā)表于 09-04 14:28 ?103次閱讀
    <b class='flag-5'>內(nèi)存</b>管理的硬件<b class='flag-5'>結(jié)構(gòu)</b>

    堆棧和內(nèi)存的基本知識

    本文主要聊聊關(guān)于堆棧的內(nèi)容。包括堆棧和內(nèi)存的基本知識。常見和堆棧相關(guān)的 bug,如棧溢出,內(nèi)存泄漏,堆內(nèi)存分配失敗等。后面介紹軟件中堆棧統(tǒng)計的重要性,以及如何使用工具工具軟件中堆棧使用
    的頭像 發(fā)表于 08-29 14:10 ?214次閱讀
    堆棧和<b class='flag-5'>內(nèi)存</b>的基本知識

    華納云:InnoDB 具有哪四大特性

    InnoDB 是 MySQL 數(shù)據(jù)庫中的一種存儲引擎,它具有許多特性,但通常被認(rèn)為有以下幾個主要特點: 行級鎖定:InnoDB 支持行級鎖定,這意味著它在處理并發(fā)事務(wù)時,只鎖定那些需要修改的行,而
    的頭像 發(fā)表于 08-14 16:02 ?215次閱讀

    集成芯片原理圖詳解

    集成芯片的原理圖詳解涉及多個方面,包括芯片的結(jié)構(gòu)、功能模塊、信號傳輸以及內(nèi)部電路連接等。
    的頭像 發(fā)表于 03-19 16:36 ?1289次閱讀

    FreeRTOS內(nèi)存機制詳解

    FreeRTOS是一種實時操作系統(tǒng),它提供了多種內(nèi)存分配方式,包括動態(tài)內(nèi)存分配和靜態(tài)內(nèi)存分配。
    的頭像 發(fā)表于 12-31 16:49 ?2085次閱讀
    FreeRTOS<b class='flag-5'>內(nèi)存</b>機制<b class='flag-5'>詳解</b>

    詳解內(nèi)存條和內(nèi)存顆粒

    在80286時代,內(nèi)存顆粒(Chip)是直接插在主板上的,叫做DIP(Dual In-line Package)。到了80386時代,換成1片焊有內(nèi)存顆粒的電路板,叫做SIMM
    的頭像 發(fā)表于 12-16 15:00 ?3123次閱讀
    <b class='flag-5'>詳解</b><b class='flag-5'>內(nèi)存</b>條和<b class='flag-5'>內(nèi)存</b>顆粒

    什么是內(nèi)存?內(nèi)存的工作原理 關(guān)于NOR和NAND的介紹和區(qū)別

    什么是內(nèi)存呢?在計算機的組成結(jié)構(gòu)中,有一個很重要的部分,就是存儲器。存儲器是用來存儲程序和數(shù)據(jù)的部件,對于計算機來說,有了存儲器,才有記憶功能,才能保證正常工作。存儲器的種類很多,按其用途可分為
    的頭像 發(fā)表于 12-07 11:02 ?2222次閱讀

    jvm內(nèi)存模型和內(nèi)存結(jié)構(gòu)

    JVM(Java虛擬機)是Java程序的運行平臺,它負(fù)責(zé)將Java程序轉(zhuǎn)換成機器碼并在計算機上執(zhí)行。在JVM中,內(nèi)存模型和內(nèi)存結(jié)構(gòu)是兩個重要的概念,本文將詳細(xì)介紹它們。 一、JVM內(nèi)存
    的頭像 發(fā)表于 12-05 11:08 ?733次閱讀

    jvm內(nèi)存溢出該如何定位解決

    超出限制和堆空間不足。 定位JVM內(nèi)存溢出問題是一個比較復(fù)雜的任務(wù),需要結(jié)合工具和技術(shù)來進(jìn)行分析和解決。本文將介紹一些常用的調(diào)試和解決內(nèi)存溢出問題的工具和技術(shù)。 一、理解JVM內(nèi)存結(jié)構(gòu)
    的頭像 發(fā)表于 12-05 11:05 ?1133次閱讀

    PCI5565反射內(nèi)存卡系統(tǒng)結(jié)構(gòu)與使用

    反射內(nèi)存卡系統(tǒng)結(jié)構(gòu)與使用 反射內(nèi)存卡系統(tǒng)結(jié)構(gòu)與使用 反射內(nèi)存卡基于 PCI 接口,是反射內(nèi)存實時
    的頭像 發(fā)表于 11-29 14:45 ?700次閱讀

    詳解高密 PCB走線布線的垂直導(dǎo)電結(jié)構(gòu) (VeCS)

    詳解高密 PCB走線布線的垂直導(dǎo)電結(jié)構(gòu) (VeCS)
    的頭像 發(fā)表于 11-28 17:00 ?1241次閱讀
    <b class='flag-5'>詳解</b>高密 PCB走線布線的垂直導(dǎo)電<b class='flag-5'>結(jié)構(gòu)</b> (VeCS)

    zRAM內(nèi)存壓縮機制詳解

    內(nèi)存是計算機系統(tǒng)最重要的資源之一,當(dāng)操作系統(tǒng)內(nèi)存不足時,進(jìn)程申請內(nèi)存將會失敗,從而導(dǎo)致其運行異常或者崩潰。
    的頭像 發(fā)表于 11-13 14:59 ?832次閱讀
    zRAM<b class='flag-5'>內(nèi)存</b>壓縮機制<b class='flag-5'>詳解</b>

    線程內(nèi)存泄漏問題的定位

    記錄一個關(guān)于線程內(nèi)存泄漏問題的定位過程,以及過程中的收獲。 1. 初步定位 是否存在內(nèi)存泄漏:想到內(nèi)存泄漏,首先查看/proc/meminfo,通過/proc/meminfo可以看出總
    的頭像 發(fā)表于 11-13 11:38 ?509次閱讀
    線程<b class='flag-5'>內(nèi)存</b>泄漏問題的定位

    從軟件角度看看內(nèi)存

    關(guān)于內(nèi)存,從軟件的角度去查看,其實作為一個軟件程序員,大多數(shù)對這個維度的接觸還是蠻多的。linux中有個free命令,其就是查看系統(tǒng)內(nèi)存的情況。 free命令的選項也比較簡單,常用的參數(shù)命令如下
    的頭像 發(fā)表于 10-30 17:41 ?608次閱讀
    從軟件角度看看<b class='flag-5'>內(nèi)存</b>