0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

介紹4種常用的MySQL同步ES方案

jf_ro2CN3Fa ? 來源:樓仔 ? 2023-11-20 10:45 ? 次閱讀

1. 前言

在實際項目開發(fā)中,我們經(jīng)常將 MySQL 作為業(yè)務數(shù)據(jù)庫,ES 作為查詢數(shù)據(jù)庫,用來實現(xiàn)讀寫分離,緩解 MySQL 數(shù)據(jù)庫的查詢壓力,應對海量數(shù)據(jù)的復雜查詢。

這其中有一個很重要的問題,就是如何實現(xiàn) MySQL 數(shù)據(jù)庫和 ES 的數(shù)據(jù)同步,今天和大家聊聊 MySQL 和 ES 數(shù)據(jù)同步的各種方案。

我們先看看下面 4 種常用的數(shù)據(jù)同步方案。

2. 數(shù)據(jù)同步方案

2.1 同步雙寫

這是一種最為簡單的方式,在將數(shù)據(jù)寫到 MySQL 時,同時將數(shù)據(jù)寫到 ES。

fd5f81fc-8748-11ee-939d-92fbcf53809c.png

優(yōu)點:

業(yè)務邏輯簡單;

實時性高。

缺點:

硬編碼,有需要寫入 MySQL 的地方都需要添加寫入 ES 的代碼;

業(yè)務強耦合;

存在雙寫失敗丟數(shù)據(jù)風險;

性能較差,本來 MySQL 的性能不是很高,再加一個 ES,系統(tǒng)的性能必然會下降。

2.2 異步雙寫

針對多數(shù)據(jù)源寫入的場景,可以借助 MQ 實現(xiàn)異步的多源寫入。

fd7a5838-8748-11ee-939d-92fbcf53809c.png

優(yōu)點:

性能高;

不易出現(xiàn)數(shù)據(jù)丟失問題,主要基于 MQ 消息的消費保障機制,比如 ES 宕機或者寫入失敗,還能重新消費 MQ 消息;

多源寫入之間相互隔離,便于擴展更多的數(shù)據(jù)源寫入。

缺點:

硬編碼問題,接入新的數(shù)據(jù)源需要實現(xiàn)新的消費者代碼;

系統(tǒng)復雜度增加,引入了消息中間件;

MQ是異步消費模型,用戶寫入的數(shù)據(jù)不一定可以馬上看到,造成延時。

2.3 基于 SQL 抽取

上面兩種方案中都存在硬編碼問題,代碼的侵入性太強,如果對實時性要求不高的情況下,可以考慮用定時器來處理:

數(shù)據(jù)庫的相關(guān)表中增加一個字段為 timestamp 的字段,任何 CURD 操作都會導致該字段的時間發(fā)生變化;

原來程序中的 CURD 操作不做任何變化;

增加一個定時器程序,讓該程序按一定的時間周期掃描指定的表,把該時間段內(nèi)發(fā)生變化的數(shù)據(jù)提取出來;

逐條寫入到 ES 中。

fd8737d8-8748-11ee-939d-92fbcf53809c.png

優(yōu)點:

不改變原來代碼,沒有侵入性、沒有硬編碼;

沒有業(yè)務強耦合,不改變原來程序的性能;

Worker 代碼編寫簡單不需要考慮增刪改查。

缺點:

時效性較差,由于是采用定時器根據(jù)固定頻率查詢表來同步數(shù)據(jù),盡管將同步周期設(shè)置到秒級,也還是會存在一定時間的延遲;

對數(shù)據(jù)庫有一定的輪詢壓力,一種改進方法是將輪詢放到壓力不大的從庫上。

經(jīng)典方案:借助 Logstash 實現(xiàn)數(shù)據(jù)同步,其底層實現(xiàn)原理就是根據(jù)配置定期使用 SQL 查詢新增的數(shù)據(jù)寫入 ES 中,實現(xiàn)數(shù)據(jù)的增量同步。

2.4 基于 Binlog 實時同步

上面三種方案要么有代碼侵入,要么有硬編碼,要么有延遲,那么有沒有一種方案既能保證數(shù)據(jù)同步的實時性又沒有代入侵入呢?

當然有,可以利用 MySQL 的 Binlog 來進行同步。

fd981472-8748-11ee-939d-92fbcf53809c.png

具體步驟如下:

讀取 MySQL 的 Binlog 日志,獲取指定表的日志信息

將讀取的信息轉(zhuǎn)為 MQ;

編寫一個 MQ 消費程序;

不斷消費 MQ,每消費完一條消息,將消息寫入到 ES 中。

優(yōu)點:

沒有代碼侵入、沒有硬編碼;

原有系統(tǒng)不需要任何變化,沒有感知;

性能高;

業(yè)務解耦,不需要關(guān)注原來系統(tǒng)的業(yè)務邏輯。

缺點:

構(gòu)建 Binlog 系統(tǒng)復雜;

如果采用 MQ 消費解析的 Binlog 信息,也會像方案二一樣存在 MQ 延時的風險。

3. 數(shù)據(jù)遷移工具選型

對于上面 4 種數(shù)據(jù)同步方案,“基于 Binlog 實時同步”方案是目前最常用的,也誕生了很多優(yōu)秀的數(shù)據(jù)遷移工具,這里主要對這些遷移工具進行介紹。

這些數(shù)據(jù)遷移工具,很多都是基于 Binlog 訂閱的方式實現(xiàn),模擬一個 MySQL Slave 訂閱 Binlog 日志,從而實現(xiàn) CDC (Change Data Capture),將已提交的更改發(fā)送到下游,包括 INSERT、DELETE、UPDATE。

至于如何偽裝?大家需要先了解 MySQL 的主從復制原理,需要學習這塊知識的同學,可以看我之前寫的高并發(fā)教程,里面有詳細講解。

3.1 Cannel

基于數(shù)據(jù)庫增量日志解析,提供增量數(shù)據(jù)訂閱&消費,目前主要支持 MySQL。

Canal 原理就是偽裝成 MySQL 的從節(jié)點,從而訂閱 master 節(jié)點的 Binlog 日志,主要流程為:

Canal 服務端向 MySQL 的 master 節(jié)點傳輸 dump 協(xié)議;

MySQL 的 master 節(jié)點接收到 dump 請求后推送 Binlog 日志給 Canal 服務端,解析 Binlog 對象(原始為 byte 流)轉(zhuǎn)成 Json 格式;

Canal 客戶端通過 TCP 協(xié)議或 MQ 形式監(jiān)聽 Canal 服務端,同步數(shù)據(jù)到 ES。

fda32ec0-8748-11ee-939d-92fbcf53809c.png

下面是 Cannel 執(zhí)行的核心流程,其中 Binlog Parser 主要負責 Binlog 的提取、解析和推送,EventSink 負責數(shù)據(jù)的過濾 、路由和加工,僅作了解即可。

fdc3d328-8748-11ee-939d-92fbcf53809c.png

3.2 阿里云 DTS

數(shù)據(jù)傳輸服務 DTS(Data Transmission Service)支持 RDBMS、NoSQL、OLAP 等多種數(shù)據(jù)源之間的數(shù)據(jù)傳輸。

它提供了數(shù)據(jù)遷移、實時數(shù)據(jù)訂閱及數(shù)據(jù)實時同步等多種數(shù)據(jù)傳輸方式。相對于第三方數(shù)據(jù)流工具,DTS 提供豐富多樣、高性能、高安全可靠的傳輸鏈路,同時它提供了諸多便利功能,極大方便了傳輸鏈路的創(chuàng)建及管理。

特點:

多數(shù)據(jù)源:支持 RDBMS、NoSQL、OLAP 等多種數(shù)據(jù)源間的數(shù)據(jù)傳輸;

多傳輸方式:支持多種傳輸方式,包括數(shù)據(jù)遷移、實時數(shù)據(jù)訂閱及數(shù)據(jù)實時同步;

高性能:底層采用了多種性能優(yōu)化措施,全量數(shù)據(jù)遷移高峰期時性能可以達到70MB/s,20萬的TPS,使用高規(guī)格服務器來保證每條遷移或同步鏈路都能擁有良好的傳輸性能;

高可用:底層為服務集群,如果集群內(nèi)任何一個節(jié)點宕機或發(fā)生故障,控制中心都能夠?qū)⑦@個節(jié)點上的所有任務快速切換到其他節(jié)點上,鏈路穩(wěn)定性高;

簡單易用:提供可視化管理界面,提供向?qū)降逆溌穭?chuàng)建流程,用戶可以在其控制臺簡單輕松地創(chuàng)建傳輸鏈路;

需要付費。

再看看 DTS 的系統(tǒng)架構(gòu)。

fdd2349a-8748-11ee-939d-92fbcf53809c.png

高可用:數(shù)據(jù)傳輸服務內(nèi)部每個模塊都有主備架構(gòu),保證系統(tǒng)高可用。容災系統(tǒng)實時檢測每個節(jié)點的健康狀況,一旦發(fā)現(xiàn)某個節(jié)點異常,會將鏈路快速切換到其他節(jié)點。

數(shù)據(jù)源地址動態(tài)適配:對于數(shù)據(jù)訂閱及同步鏈路,容災系統(tǒng)還會監(jiān)測數(shù)據(jù)源的連接地址切換等變更操作,一旦發(fā)現(xiàn)數(shù)據(jù)源發(fā)生連接地址變更,它會動態(tài)適配數(shù)據(jù)源新的連接方式,在數(shù)據(jù)源變更的情況下,保證鏈路的穩(wěn)定性。

3.3 Databus

Databus 是一個低延遲、可靠的、支持事務的、保持一致性的數(shù)據(jù)變更抓取系統(tǒng)。由 LinkedIn 于 2013 年開源。

Databus 通過挖掘數(shù)據(jù)庫日志的方式,將數(shù)據(jù)庫變更實時、可靠的從數(shù)據(jù)庫拉取出來,業(yè)務可以通過定制化 client 實時獲取變更并進行其他業(yè)務邏輯。

特點:

多數(shù)據(jù)源:Databus 支持多種數(shù)據(jù)來源的變更抓取,包括 Oracle 和 MySQL。

可擴展、高度可用:Databus 能擴展到支持數(shù)千消費者和事務數(shù)據(jù)來源,同時保持高度可用性。

事務按序提交:Databus 能保持來源數(shù)據(jù)庫中的事務完整性,并按照事務分組和來源的提交順尋交付變更事件。

低延遲、支持多種訂閱機制:數(shù)據(jù)源變更完成后,Databus 能在毫秒級內(nèi)將事務提交給消費者。同時,消費者使用D atabus 中的服務器端過濾功能,可以只獲取自己需要的特定數(shù)據(jù)。

無限回溯:對消費者支持無限回溯能力,例如當消費者需要產(chǎn)生數(shù)據(jù)的完整拷貝時,它不會對數(shù)據(jù)庫產(chǎn)生任何額外負擔。當消費者的數(shù)據(jù)大大落后于來源數(shù)據(jù)庫時,也可以使用該功能。

再看看 Databus 的系統(tǒng)架構(gòu)。

Databus 由 Relays、bootstrap 服務和 Client lib 等組成,Bootstrap 服務中包括 Bootstrap Producer 和 Bootstrap Server。

fde5760e-8748-11ee-939d-92fbcf53809c.png

快速變化的消費者直接從 Relay 中取事件;

如果一個消費者的數(shù)據(jù)更新大幅落后,它要的數(shù)據(jù)就不在 Relay 的日志中,而是需要請求 Bootstrap 服務,返回的將會是自消費者上次處理變更之后的所有數(shù)據(jù)變更快照。

3.4 其它

Flink

有界數(shù)據(jù)流和無界數(shù)據(jù)流上進行有狀態(tài)計算分布式處理引擎和框架。

CloudCanal

數(shù)據(jù)同步遷移系統(tǒng),商業(yè)產(chǎn)品

Maxwell

使用簡單,直接將數(shù)據(jù)變更輸出為json字符串,不需要再編寫客戶端。

DRD

阿里巴巴集團自主研發(fā)的分布式數(shù)據(jù)庫中間件產(chǎn)品,專注于解決單機關(guān)系型數(shù)據(jù)庫擴展性問題,具備輕量(無狀態(tài))、靈活、穩(wěn)定、高效等特性。

yugong

幫助用戶完成從 Oracle 數(shù)據(jù)遷移到 MySQL。

4. 后記

通過這篇文章,讓你知道 MySQL 和其它多維數(shù)據(jù)的同步方案,以及常用的數(shù)據(jù)遷移工具,幫助你更好選型。






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 定時器
    +關(guān)注

    關(guān)注

    23

    文章

    3218

    瀏覽量

    113675
  • SQL
    SQL
    +關(guān)注

    關(guān)注

    1

    文章

    750

    瀏覽量

    43900
  • MySQL
    +關(guān)注

    關(guān)注

    1

    文章

    789

    瀏覽量

    26283
  • MYSQL數(shù)據(jù)庫
    +關(guān)注

    關(guān)注

    0

    文章

    95

    瀏覽量

    9346

原文標題:4 種 MySQL 同步 ES 方案,yyds!

文章出處:【微信號:芋道源碼,微信公眾號:芋道源碼】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    Linux中常用MySQL運維腳本

    在Linux中,使用MySQL進行常見的運維任務時,可以編寫一些腳本來簡化操作。以下是一些常用MySQL運維腳本,希望對你的工作有所幫助。
    發(fā)表于 09-07 09:49 ?702次閱讀

    0基礎(chǔ)學Mysql:mysql入門視頻教程!

    的性能調(diào)優(yōu)技術(shù)掌握基于MySQL的架構(gòu)設(shè)計方案課程目錄:第1節(jié) MySQL課程介紹MySQL的基礎(chǔ)概念(1)第2節(jié)
    發(fā)表于 07-08 10:51

    MySQL及其常用命令介紹

    MySQL 數(shù)據(jù)庫常用命令
    發(fā)表于 04-12 13:19

    linux配置mysql的兩方式

    方式:a、$ find / -name mysql–print 查看是否有mysql文件夾b、$ netstat -a –n 查看是否打開3306端口
    發(fā)表于 07-26 07:46

    Canal是如何同步mysql的增量數(shù)據(jù)的

    Canal是什么?Canal的工作原理是什么?Canal是如何同步mysql的增量數(shù)據(jù)的?
    發(fā)表于 10-27 07:41

    mysql數(shù)據(jù)庫同步原理

    了數(shù)據(jù)庫的訪問壓力,提升整個系統(tǒng)的性能和可用性,降低了大訪問量引發(fā)數(shù)據(jù)庫宕機的故障率。 binlog簡介 MySQL主從同步是基于binlog文件主從復制實現(xiàn),為了更好的理解主從同步過程,這里簡單
    發(fā)表于 09-28 11:49 ?0次下載
    <b class='flag-5'>mysql</b>數(shù)據(jù)庫<b class='flag-5'>同步</b>原理

    Mysql主從同步的實現(xiàn)原理

    MySQL是一個關(guān)系型數(shù)據(jù)庫管理系統(tǒng),由瑞典MySQL AB 公司開發(fā),目前屬于 Oracle 旗下產(chǎn)品。MySQL 是最流行的關(guān)系型數(shù)據(jù)庫管理系統(tǒng)之一,在 WEB 應用方面,MySQL
    發(fā)表于 12-26 15:56 ?2929次閱讀
    <b class='flag-5'>Mysql</b>主從<b class='flag-5'>同步</b>的實現(xiàn)原理

    Linux中的常用多線程同步方式淺析

    嵌入式linux中文站給大家介紹Linux中的常用多線程同步方式:互斥量,條件變量,信號量。
    發(fā)表于 05-02 14:49 ?2975次閱讀
    三<b class='flag-5'>種</b>Linux中的<b class='flag-5'>常用</b>多線程<b class='flag-5'>同步</b>方式淺析

    CCD驅(qū)動電路的4常用方式介紹和使用單片機設(shè)計CCD驅(qū)動電路的說明

    介紹了CCD驅(qū)動電路的4常用方式及其優(yōu)缺點,詳細闡述了基于高速超微型單片機C8051F300的CCD驅(qū)動電路設(shè)計,包括內(nèi)部CCD驅(qū)動時序和外部輸出
    發(fā)表于 11-26 16:58 ?28次下載
    CCD驅(qū)動電路的<b class='flag-5'>4</b><b class='flag-5'>種</b><b class='flag-5'>常用</b>方式<b class='flag-5'>介紹</b>和使用單片機設(shè)計CCD驅(qū)動電路的說明

    MySQL批量插入數(shù)據(jù)的四方案(性能測試對比)

    本文記錄個人使用MySQL插入大數(shù)據(jù)總結(jié)較實用的方案,通過對常用插入大數(shù)據(jù)的4方式進行測試,即for循環(huán)單條、拼接SQL、批量插入save
    的頭像 發(fā)表于 10-28 09:43 ?2562次閱讀

    深度解讀ES+Redis+MySQL的高可用架構(gòu)設(shè)計

    我們有兩個機房,分別是機房 A 和機房 B。我們把 ES 主集群部署在機房 A,把 ES 備集群部署在機房 B。會員系統(tǒng)的讀寫都在 ES 主集群,通過 MQ 將數(shù)據(jù)同步
    的頭像 發(fā)表于 06-01 10:09 ?625次閱讀
    深度解讀<b class='flag-5'>ES+Redis+MySQL</b>的高可用架構(gòu)設(shè)計

    MySQL運維常用腳本

    進入MySQL:啟動MySQL Command Line Client(MySQL的DOS界面),直接輸入安裝時的密碼即可。此時的提示符是:mysql>
    的頭像 發(fā)表于 07-29 11:23 ?496次閱讀

    MySQLES4常用數(shù)據(jù)同步方案

    如何實現(xiàn) MySQL 數(shù)據(jù)庫和 ES 的數(shù)據(jù)同步,今天和大家聊聊 MySQLES 數(shù)據(jù)同步
    發(fā)表于 08-09 11:36 ?523次閱讀
    <b class='flag-5'>MySQL</b>到<b class='flag-5'>ES</b>的<b class='flag-5'>4</b><b class='flag-5'>種</b><b class='flag-5'>常用</b>數(shù)據(jù)<b class='flag-5'>同步</b><b class='flag-5'>方案</b>

    MySQL常用語句

    MySQL是一個關(guān)系型數(shù)據(jù)庫管理系統(tǒng),廣泛應用于Web應用程序的開發(fā)以及數(shù)據(jù)管理領(lǐng)域。在使用MySQL時,有一些常用的語句可以幫助我們進行數(shù)據(jù)的操作和管理。接下來,我將詳細介紹
    的頭像 發(fā)表于 11-21 11:11 ?420次閱讀

    php的mysql無法啟動

    MySQL是一常用的關(guān)系型數(shù)據(jù)庫管理系統(tǒng),而PHP是一廣泛應用于服務器端的腳本語言。在使用PHP開發(fā)網(wǎng)站或應用時,經(jīng)常會碰到MySQL
    的頭像 發(fā)表于 12-04 15:59 ?1085次閱讀