0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Buffer與cache的區(qū)別

Linux愛好者 ? 來源:Linux愛好者 ? 作者:Linux愛好者 ? 2022-07-01 10:44 ? 次閱讀

一。 先需要了解Buffer 與 cache 的區(qū)別

Bbuffer 與 Cache 非常類似,因為它們都用于存儲數(shù)據(jù)數(shù)據(jù),被應(yīng)用層讀取字節(jié)數(shù)據(jù)。在很多場合它們有著相同的概念:

首先從翻譯上,Buffer應(yīng)該翻譯為“緩沖”,Cache應(yīng)該翻譯為“緩存”,兩個完全不是一個東西。

硬件這一層看,Buffer應(yīng)該為內(nèi)存,Cache為CPU集成的告訴緩存。

Buffer為了讓不同速度的設(shè)備能夠同步,建立的一個緩沖區(qū)域,寫進(jìn)Buffer的數(shù)據(jù)是為了從中拿出寫入其他設(shè)備。

Cache是為了提高讀取速度,將經(jīng)?;蝰R上需要的數(shù)據(jù)預(yù)讀到緩存中,寫進(jìn)Cache的數(shù)據(jù)是為了其他設(shè)備從中去讀取。

從軟件這一層來說,Buffer是塊設(shè)備的緩沖,Cache是文件系統(tǒng)的緩存。以Linux為例,Buffer(Buffer Cache)以塊形式緩沖了塊設(shè)備的操作,定時或手動的同步到硬盤,它是為了緩沖寫操作然后一次性將很多改動寫入硬盤,避免頻繁寫硬盤,提高寫入效率。

Cache(Page Cache)以頁面形式緩存了文件系統(tǒng)的文件,給需要使用的程序讀取,它是為了給讀操作提供緩沖,避免頻繁讀硬盤,提高讀取效率。

總而言之,Buffer里面的東西是為了寫到別處去,Cache里面的東西是為了給別處讀。

Buffer 與 Cache 的用途有所不一定:

Buffer 的主要目的是在不同應(yīng)用、線程、進(jìn)程之間共享字節(jié)數(shù)據(jù),例如為了讓不同速度的設(shè)備能夠進(jìn)行數(shù)據(jù)同步,就會使用共享 Buffer;

Cache 的主要目的是提高字節(jié)數(shù)據(jù)的讀取/寫入速度,例如根據(jù)時間局部性、地址局部性操作系統(tǒng)提供 page cache 機(jī)制;

當(dāng)然,在很多場合下 Buffer 與 Cache 有著相同的語義,因此我們可以認(rèn)為緩沖區(qū)既用于提高讀寫速度,又用于數(shù)據(jù)共享與同步。

關(guān)于零拷貝深入理解:

c7a8936e-f504-11ec-ba43-dac502259ad0.jpg

二。 MySQL 緩沖區(qū)設(shè)計

MySQL 的緩沖區(qū)設(shè)計如下圖所示:

c7c189f0-f504-11ec-ba43-dac502259ad0.png

Figure1.MySQL 的緩沖區(qū)設(shè)計

如上圖所示,MySQL 在不同層次使用了與緩存機(jī)制不同的配套技術(shù)。其中有:

應(yīng)用層:

Redo Log Buffer:對寫操作進(jìn)行緩存,用于實現(xiàn) MySQL InnoDB 的事務(wù)性;

InnoDB Buffer Pool:用于對 MySQL table 的數(shù)據(jù)進(jìn)行緩存。讀內(nèi)存而不是磁盤,通過減少磁盤讀操的方式提高讀操作性能;寫內(nèi)存而不是磁盤,通過減少磁盤寫操的方式提高寫操作性能;

操作系統(tǒng)的 VFS(Virtual file system,虛擬文件系統(tǒng))層:

Page Cache:操作系統(tǒng)通過緩存以及預(yù)讀機(jī)制對文件系統(tǒng)中的 block 基于 page 進(jìn)行緩存管理;

Direct Buffer:當(dāng)使用 Direct I/O 提供的相關(guān) API 時,操作系統(tǒng)不再提供基于 Page Cache 機(jī)制的緩存,而是直接使用 Direct Buffer;

磁盤的 Disk Buffer:磁盤也可以提供磁盤緩存,通常在 MySQL 中會關(guān)閉磁盤緩存,我們僅僅需要了解有 Disk Buffer 這一概念即可。

三。 Write Through/Back 與 Direct I/O

Write Through 與 Write Back 指的是在使用內(nèi)存空間作為緩存的應(yīng)用在處理寫操作時是否直接落盤:

Write Through:寫操作“穿過”緩存區(qū)直接落盤,這種策略能夠確保數(shù)據(jù)不會因為宕機(jī)而丟失內(nèi)存緩沖區(qū)的數(shù)據(jù);

Write Back:一次寫操作僅僅更新了內(nèi)存緩存區(qū)中的數(shù)據(jù),數(shù)據(jù)落盤通常通過間隔一個時間進(jìn)行落盤一次;

MySQL 為此提供了一些參數(shù)來控制 Page Cache 數(shù)據(jù)落盤的具體行為,例如:

(1)innodb_flush_log_at_trx_commit

innodb_flush_log_at_trx_commit 參數(shù)用于控制基于 Page Cache 的 Redo Log Buffer 的數(shù)據(jù)落盤機(jī)制[2]。此參數(shù)用于控制以下兩個特性之間的平衡:

嚴(yán)格的事務(wù)管理機(jī)制;

事務(wù)提交 commit 操作執(zhí)行時的高性能;

innodb_flush_log_at_trx_commit 有三個可選配置值:

1(默認(rèn)值):每次事務(wù)提交時都日志必須刷新到磁盤上,提供了最可靠的事務(wù)性保證;

0:日志每間隔 1 秒刷新到磁盤上,這意味著在緩存中還沒有來得及刷新到磁盤上的數(shù)據(jù)在宕機(jī)時會丟失;

2:日志在事務(wù)提交后以及每間隔 1 秒刷新到磁盤上,這意味著在緩存中還沒有來得及刷新到磁盤上的數(shù)據(jù)在宕機(jī)時會丟失;

注意事項:配置 0 與 2 并不能保證 100% 每間隔一秒刷新到磁盤一次,這是因為 DDL 的修改以及 InnoDB 活動可能會導(dǎo)致日志刷新更頻繁。另一方面,由于事務(wù)調(diào)度問題,刷新頻率甚至?xí)档汀?/p>

刷新頻率默認(rèn)為 1 s,由參數(shù) innodb_flush_log_at_timeout 進(jìn)行配置。

(2)innodb_flush_method

innodb_flush_method 參數(shù)同時控制 redo log buffer 和 innodb buffer pool 緩沖區(qū)刷新策略,其中:

log files:redo log buffer 是 log files 在內(nèi)存中的緩存區(qū), log files 是磁盤上的 Redo Log 文件;

data files:innodb buffer pool 是 data files 在內(nèi)存中的緩存區(qū),data files 是磁盤上的數(shù)據(jù)文件(B+tree);

innodb_flush_method 參數(shù)目前有 6 種可選配置值[3]:

fdatasync;

O_DSYNC

O_DIRECT

O_DIRECT_NO_FSYNC

littlesync

nosync

這里只討論 Unix-like 操作系統(tǒng),而不討論 Windows 系統(tǒng)。

其中,littlesync 與 nosync 僅僅用于內(nèi)部性能測試,并不建議使用。

fdatasync,即取值 0,這是默認(rèn)配置值。對 log files 以及 data files 都采用 fsync 的方式進(jìn)行同步;

O_DSYNC,即取值 1。對 log files 使用 O_SYNC 打開與刷新日志文件,使用 fsync 來刷新 data files 中的數(shù)據(jù);

O_DIRECT,即取值 4。利用 Direct I/O 的方式打開 data file,并且每次寫操作都通過執(zhí)行 fsync 系統(tǒng)調(diào)用的方式落盤;

O_DIRECT_NO_FSYNC,即取值 5。利用 Direct I/O 的方式打開 data files,但是每次寫操作并不會調(diào)用 fsync 系統(tǒng)調(diào)用進(jìn)行落盤;

補(bǔ)充說明:以 O_SYNC 方式打開文件意味著文件的每一次寫操作都直接導(dǎo)致將數(shù)據(jù)本身以及元數(shù)據(jù)刷新到磁盤上。

為什么有 O_DIRECT 與 O_DIRECT_NO_FSYNC 配置的區(qū)別?

首先,我們需要理解更新操作落盤分為兩個具體的子步驟:

①文件數(shù)據(jù)更新落盤

②文件元數(shù)據(jù)更新落盤。

O_DIRECT 的在部分操作系統(tǒng)中會導(dǎo)致文件元數(shù)據(jù)不落盤,除非主動調(diào)用 fsync,為此,MySQL 提供了 O_DIRECT 以及 O_DIRECT_NO_FSYNC 這兩個配置[5]。

如果你確定在自己的操作系統(tǒng)上,即使不進(jìn)行 fsync 調(diào)用,也能夠確保文件元數(shù)據(jù)落盤,那么請使用 O_DIRECT_NO_FSYNC 配置,這對 MySQL 性能略有幫助。否則,請使用 O_DIRECT,不然文件元數(shù)據(jù)的丟失可能會導(dǎo)致 MySQL 運(yùn)行錯誤。

四。 MySQL 日志的刷新策略

MySQL 日志刷新策略通過 sync_binlog 參數(shù)進(jìn)行配置,其有 3 個可選配置:

sync_binlog=0:MySQL 應(yīng)用將完全不負(fù)責(zé)日志同步到磁盤,將緩存中的日志數(shù)據(jù)刷新到磁盤全權(quán)交給操作系統(tǒng)來完成;

sync_binlog=1:MySQL 應(yīng)用在事務(wù)提交前將緩存區(qū)的日志刷新到磁盤;

sync_binlog=N:當(dāng) N 不為 0 與 1 時,MySQL 在收集到 N 個日志提交后,才會將緩存區(qū)的日志同步到磁盤。

事實上,這個參數(shù)也用于控制日志是通過 Write Through 還是 Write Back 策略刷新到磁盤上。

注意事項:使用 Page Cache 機(jī)制的數(shù)據(jù)刷盤機(jī)制,即使基于同步策略,即每次寫操作都要求數(shù)據(jù)直接落盤,但在數(shù)據(jù)落盤之前,數(shù)據(jù)總是先要寫于 Page Cache 中,再將 Page Cache 中的具體 Page 刷新到磁盤上。

五。 MySQL 的典型配置

innodb_flush_log_at_trx_commit 參數(shù)配置為 1:Redo Log 走 Page Cache,并且每次寫操作的日志在事務(wù)提交前都通過 fsync 刷新到磁盤;

innodb_flush_method 參數(shù)配置為 O_DIRECT:InnoDB Buffer Pool 走 Direct I/O,并且每次寫操作導(dǎo)致的文件數(shù)據(jù)(包括文件元數(shù)據(jù))都通過 fsync 系統(tǒng)調(diào)用刷新到磁盤;

寫一條 redo log 涉及到的步驟有:

日志寫入 Redo Log buffer;

日志寫入 Page Cache;

通過系統(tǒng)調(diào)用 fsync 將 Page Cache 中的臟頁刷新到磁盤;

日志提交;

修改表的一行記錄涉及到的步驟有:

更新后的數(shù)據(jù)寫于 InnoDB Buffer Pool;

定時進(jìn)行如下邏輯(異步進(jìn)行):

InnoDB Buffer Pool 臟數(shù)據(jù)進(jìn)行刷新,通過文件的 write 方法進(jìn)行;

文件的 write 方法直接導(dǎo)致數(shù)據(jù)寫于磁盤上;

定時進(jìn)行文件的 fysnc 調(diào)用,確保文件元數(shù)據(jù)寫于磁盤上;

REFERENCE

[1]Buffer與Cache

[2]MySQL :: MySQL 8.0 Reference Manual :: 15.14 InnoDB Startup Options and System Variables

[3]MySQL 8.0 innodb_flush_method

[4]MySQL :: MySQL 8.0 Reference Manual :: 17.1.6.4 Binary Logging Options and Variables

[5] Why MYSQL still use fsync() to flush the data when the option is O_DIRECT?

原文標(biāo)題:MySQL 的零拷貝技術(shù)

文章出處:【微信公眾號:Linux愛好者】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 硬盤
    +關(guān)注

    關(guān)注

    3

    文章

    1284

    瀏覽量

    57199
  • Cache
    +關(guān)注

    關(guān)注

    0

    文章

    129

    瀏覽量

    28274
  • buffer
    +關(guān)注

    關(guān)注

    2

    文章

    120

    瀏覽量

    29985
  • 存儲數(shù)據(jù)
    +關(guān)注

    關(guān)注

    0

    文章

    85

    瀏覽量

    14083

原文標(biāo)題:MySQL 的零拷貝技術(shù)

文章出處:【微信號:LinuxHub,微信公眾號:Linux愛好者】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    Cache和內(nèi)存有什么區(qū)別

    Cache(高速緩存)和內(nèi)存(Memory,通常指主存儲器或RAM)是計算機(jī)存儲系統(tǒng)中兩個重要的組成部分,它們在計算機(jī)的性能和數(shù)據(jù)處理中扮演著不同的角色。以下是對Cache和內(nèi)存之間區(qū)別的詳細(xì)解析。
    的頭像 發(fā)表于 09-26 15:28 ?801次閱讀

    寄存器和高速緩存有什么區(qū)別

    寄存器和高速緩存(Cache)都是計算機(jī)系統(tǒng)中用于存儲數(shù)據(jù)的重要組成部分,但它們在功能、位置、容量、速度以及使用方式上存在著顯著的區(qū)別。
    的頭像 發(fā)表于 09-10 14:32 ?807次閱讀

    高速緩沖存儲器與內(nèi)存的區(qū)別

    高速緩沖存儲器(Cache)與內(nèi)存(Memory)在計算機(jī)體系結(jié)構(gòu)中扮演著至關(guān)重要的角色,它們之間存在顯著的區(qū)別。以下將從定義、功能、技術(shù)特點、作用機(jī)制等多個方面詳細(xì)闡述這兩者的區(qū)別。
    的頭像 發(fā)表于 09-10 14:12 ?937次閱讀

    解析Arm Neoverse N2 PMU事件L2D_CACHE_WR

    有客戶希望我們幫忙分析 Eigen gemm 基準(zhǔn)測試的一些執(zhí)行情況。具體來說是為什么 L1D_CACHE_WR 的值會低于 L2D_CACHE_WR,這種情況令人費解。
    的頭像 發(fā)表于 09-03 11:42 ?1134次閱讀
    解析Arm Neoverse N2 PMU事件L2D_<b class='flag-5'>CACHE</b>_WR

    Cortex R52內(nèi)核Cache的具體操作(2)

    本節(jié)內(nèi)容主要講述CortexR52內(nèi)核Cache的具體操作包括使緩存無效(invalidate)操作,清除(clean)緩存。有的時候客戶可能需要對cache做一些清理,比如invalidate
    的頭像 發(fā)表于 07-15 15:44 ?1169次閱讀
    Cortex R52內(nèi)核<b class='flag-5'>Cache</b>的具體操作(2)

    Cortex R52內(nèi)核Cache的相關(guān)概念(1)

    在開始閱讀本系列文章之前,請先參閱《有關(guān)CR52 MPU配置說明》。因為這篇文章講述了,cache配置所涉及到的寄存器的設(shè)置和MPU的一些基本概念。如果讀者都已經(jīng)理解了上述內(nèi)容,可以跳過。本章內(nèi)容主要講述cache屬性的具體含意、注意事項、以及在RZ/T2M的性能測試。
    的頭像 發(fā)表于 07-15 10:37 ?1254次閱讀
    Cortex R52內(nèi)核<b class='flag-5'>Cache</b>的相關(guān)概念(1)

    CortexR52內(nèi)核Cache的具體操作

    本節(jié)內(nèi)容主要講述CortexR52內(nèi)核Cache的具體操作包括使緩存無效(invalidate)操作,清除(clean)緩存。有的時候客戶可能需要對cache做一些清理,比如invalidate
    的頭像 發(fā)表于 07-15 10:32 ?1123次閱讀
    CortexR52內(nèi)核<b class='flag-5'>Cache</b>的具體操作

    OpenHarmony語言基礎(chǔ)類庫【@ohos.buffer (Buffer)】

    Buffer對象用于表示固定長度的字節(jié)序列,是專門存放二進(jìn)制數(shù)據(jù)的緩存區(qū)。
    的頭像 發(fā)表于 04-23 17:34 ?807次閱讀
    OpenHarmony語言基礎(chǔ)類庫【@ohos.<b class='flag-5'>buffer</b> (<b class='flag-5'>Buffer</b>)】

    為什么HAL庫在操作Flash erase的時候,需要把I-Cache和D-Cache關(guān)閉呢?

    請問為什么HAL庫在操作Flash erase的時候,需要把I-Cache和D-Cache關(guān)閉呢? 這有什么原因呢? 有人可以解答嗎?
    發(fā)表于 04-07 09:08

    請問STM32MP13X的MMU和Cache如何使能?

    STM32MP13X的MMU和Cache如何使能?修改了hal_conf里的DATA_CACHE_ENABLE的宏console里還是顯示沒開,在設(shè)置里的Define symbols把NO_CACHE_USE刪了好像還是不行。。
    發(fā)表于 03-12 06:46

    在AurixTC375上使用CAN...使用Rx Fifo和Rx Buffer有什么區(qū)別?

    我在 Aurix TC375 上使用 CAN...使用 Rx Fifo 和 Rx Buffer 有什么區(qū)別? 兩者在初始化時是相同的,數(shù)據(jù)表沒有說明你為什么要使用一個而不是另一個... 有什么想法嗎?
    發(fā)表于 01-19 08:00

    時鐘Buffer芯片是什么?其作用是啥?它被用在什么地方?

    時鐘Buffer芯片是什么?其作用是啥?它被用在什么地方? 時鐘Buffer芯片是一種用于管理和增強(qiáng)電子設(shè)備中的時鐘信號的集成電路。時鐘信號在數(shù)字電子設(shè)備中非常重要,它用于同步各個模塊的工作,確保
    的頭像 發(fā)表于 01-16 15:10 ?3905次閱讀

    buffercache區(qū)別

    buffercache區(qū)別 緩沖區(qū)(Buffer)和緩存(Cache)是計算機(jī)系統(tǒng)中用于提高數(shù)據(jù)讀寫效率的兩個關(guān)鍵概念,它們雖然功能有所
    的頭像 發(fā)表于 12-07 11:00 ?783次閱讀

    CPU Cache是如何保證緩存一致性的?

    我們介紹`CPU Cache`的組織架構(gòu)及其進(jìn)行**讀操作**時的尋址方式,但是緩存不僅僅只有讀操作,還有 **寫操作** ,這會帶來一個新的問題
    的頭像 發(fā)表于 12-04 15:05 ?1264次閱讀
    CPU <b class='flag-5'>Cache</b>是如何保證緩存一致性的?

    什么是always on buffer?什么情況下需要插always on buffer?

    相比普通的buffer cell,always on buffer(AOB)有secondary always on pin,可以讓AOB即使在primary power off的情況下保持on的狀態(tài);AOB在secondary pg pin off的情況下也是off的。
    的頭像 發(fā)表于 12-01 15:31 ?2271次閱讀
    什么是always on <b class='flag-5'>buffer</b>?什么情況下需要插always on <b class='flag-5'>buffer</b>?