0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何構(gòu)建一個(gè)穩(wěn)定、高性能的Redis集群?

數(shù)據(jù)分析與開(kāi)發(fā) ? 來(lái)源:數(shù)據(jù)分析與開(kāi)發(fā) ? 作者:數(shù)據(jù)分析與開(kāi)發(fā) ? 2021-03-03 15:05 ? 次閱讀

這篇文章我想和你聊一聊 Redis 的架構(gòu)演化之路。

現(xiàn)如今 Redis 變得越來(lái)越流行,幾乎在很多項(xiàng)目中都要被用到,不知道你在使用 Redis 時(shí),有沒(méi)有思考過(guò),Redis 到底是如何穩(wěn)定、高性能地提供服務(wù)的?

你也可以嘗試回答一下以下這些問(wèn)題:

我使用 Redis 的場(chǎng)景很簡(jiǎn)單,只使用單機(jī)版 Redis 會(huì)有什么問(wèn)題嗎?

我的 Redis 故障宕機(jī)了,數(shù)據(jù)丟失了怎么辦?如何能保證我的業(yè)務(wù)應(yīng)用不受影響?

為什么需要主從集群?它有什么優(yōu)勢(shì)?

什么是分片集群?我真的需要分片集群?jiǎn)幔?/p>

...

如果你對(duì) Redis 已經(jīng)有些了解,肯定也聽(tīng)說(shuō)過(guò)數(shù)據(jù)持久化、主從復(fù)制、哨兵這些概念,它們之間又有什么區(qū)別和聯(lián)系呢?

如果你存在這樣的疑惑,這篇文章,我會(huì)從 0 到 1,再?gòu)?1 到 N,帶你一步步構(gòu)建出一個(gè)穩(wěn)定、高性能的 Redis 集群。

在這個(gè)過(guò)程中,你可以了解到 Redis 為了做到穩(wěn)定、高性能,都采取了哪些優(yōu)化方案,以及為什么要這么做?

掌握了這些原理,這樣平時(shí)你在使用 Redis 時(shí),就能夠做到「游刃有余」。

這篇文章干貨很多,希望你可以耐心讀完。

從最簡(jiǎn)單的開(kāi)始:?jiǎn)螜C(jī)版 Redis

首先,我們從最簡(jiǎn)單的場(chǎng)景開(kāi)始。

假設(shè)現(xiàn)在你有一個(gè)業(yè)務(wù)應(yīng)用,需要引入 Redis 來(lái)提高應(yīng)用的性能,此時(shí)你可以選擇部署一個(gè)單機(jī)版的 Redis 來(lái)使用,就像這樣:

這個(gè)架構(gòu)非常簡(jiǎn)單,你的業(yè)務(wù)應(yīng)用可以把 Redis 當(dāng)做緩存來(lái)使用,從 MySQL 中查詢數(shù)據(jù),然后寫(xiě)入到 Redis 中,之后業(yè)務(wù)應(yīng)用再?gòu)?Redis 中讀取這些數(shù)據(jù),由于 Redis 的數(shù)據(jù)都存儲(chǔ)在內(nèi)存中,所以這個(gè)速度飛快。

如果你的業(yè)務(wù)體量并不大,那這樣的架構(gòu)模型基本可以滿足你的需求。是不是很簡(jiǎn)單?

隨著時(shí)間的推移,你的業(yè)務(wù)體量逐漸發(fā)展起來(lái)了,Redis 中存儲(chǔ)的數(shù)據(jù)也越來(lái)越多,此時(shí)你的業(yè)務(wù)應(yīng)用對(duì) Redis 的依賴也越來(lái)越重。

但是,突然有一天,你的 Redis 因?yàn)槟承┰蝈礄C(jī)了,這時(shí)你的所有業(yè)務(wù)流量,都會(huì)打到后端 MySQL 上,這會(huì)導(dǎo)致你的 MySQL 壓力劇增,嚴(yán)重的話甚至?xí)嚎?MySQL。

這時(shí)你應(yīng)該怎么辦?

我猜你的方案肯定是,趕緊重啟 Redis,讓它可以繼續(xù)提供服務(wù)。

但是,因?yàn)橹?Redis 中的數(shù)據(jù)都在內(nèi)存中,盡管你現(xiàn)在把 Redis 重啟了,之前的數(shù)據(jù)也都丟失了。重啟后的 Redis 雖然可以正常工作,但是由于 Redis 中沒(méi)有任何數(shù)據(jù),業(yè)務(wù)流量還是都會(huì)打到后端 MySQL 上,MySQL 的壓力還是很大。

這可怎么辦?你陷入了沉思。

有沒(méi)有什么好的辦法解決這個(gè)問(wèn)題?

既然 Redis 只把數(shù)據(jù)存儲(chǔ)在內(nèi)存中,那是否可以把這些數(shù)據(jù)也寫(xiě)一份到磁盤(pán)上呢?

如果采用這種方式,當(dāng) Redis 重啟時(shí),我們把磁盤(pán)中的數(shù)據(jù)快速恢復(fù)到內(nèi)存中,這樣它就可以繼續(xù)正常提供服務(wù)了。

是的,這是一個(gè)很好的解決方案,這個(gè)把內(nèi)存數(shù)據(jù)寫(xiě)到磁盤(pán)上的過(guò)程,就是「數(shù)據(jù)持久化」。

數(shù)據(jù)持久化:有備無(wú)患

現(xiàn)在,你設(shè)想的 Redis 數(shù)據(jù)持久化是這樣的:

但是,數(shù)據(jù)持久化具體應(yīng)該怎么做呢?

我猜你最容易想到的一個(gè)方案是,Redis 每一次執(zhí)行寫(xiě)操作,除了寫(xiě)內(nèi)存之外,同時(shí)也寫(xiě)一份到磁盤(pán)上,就像這樣:

92f7803e-7b71-11eb-8b86-12bb97331649.jpg

沒(méi)錯(cuò),這是最簡(jiǎn)單直接的方案。

但仔細(xì)想一下,這個(gè)方案有個(gè)問(wèn)題:客戶端的每次寫(xiě)操作,既需要寫(xiě)內(nèi)存,又需要寫(xiě)磁盤(pán),而寫(xiě)磁盤(pán)的耗時(shí)相比于寫(xiě)內(nèi)存來(lái)說(shuō),肯定要慢很多!這勢(shì)必會(huì)影響到 Redis 的性能。

如何規(guī)避這個(gè)問(wèn)題?

我們可以這樣優(yōu)化:Redis 寫(xiě)內(nèi)存由主線程來(lái)做,寫(xiě)內(nèi)存完成后就給客戶端返回結(jié)果,然后 Redis 用另一個(gè)線程去寫(xiě)磁盤(pán),這樣就可以避免主線程寫(xiě)磁盤(pán)對(duì)性能的影響。

這確實(shí)是一個(gè)好方案。除此之外,我們可以換個(gè)角度,思考一下還有什么方式可以持久化數(shù)據(jù)?

這時(shí)你就要結(jié)合 Redis 的使用場(chǎng)景來(lái)考慮了。

回憶一下,我們?cè)谑褂?Redis 時(shí),通常把它用作什么場(chǎng)景?

是的,緩存。

把 Redis 當(dāng)做緩存來(lái)用,意味著盡管 Redis 中沒(méi)有保存全量數(shù)據(jù),對(duì)于不在緩存中的數(shù)據(jù),我們的業(yè)務(wù)應(yīng)用依舊可以通過(guò)查詢后端數(shù)據(jù)庫(kù)得到結(jié)果,只不過(guò)查詢后端數(shù)據(jù)的速度會(huì)慢一點(diǎn)而已,但對(duì)業(yè)務(wù)結(jié)果其實(shí)是沒(méi)有影響的。

基于這個(gè)特點(diǎn),我們的 Redis 數(shù)據(jù)持久化還可以用「數(shù)據(jù)快照」的方式來(lái)做。

那什么是數(shù)據(jù)快照呢?

簡(jiǎn)單來(lái)講,你可以這么理解:

你把 Redis 想象成一個(gè)水杯,向 Redis 寫(xiě)入數(shù)據(jù),就相當(dāng)于往這個(gè)杯子里倒水

此時(shí)你拿一個(gè)相機(jī)給這個(gè)水杯拍一張照片,拍照的這一瞬間,照片中記錄到這個(gè)水杯中水的容量,就是水杯的數(shù)據(jù)快照

931b0a54-7b71-11eb-8b86-12bb97331649.jpg

也就是說(shuō),Redis 的數(shù)據(jù)快照,是記錄某一時(shí)刻下 Redis 中的數(shù)據(jù),然后只需要把這個(gè)數(shù)據(jù)快照寫(xiě)到磁盤(pán)上就可以了。

它的優(yōu)勢(shì)在于,只在需要持久化時(shí),把數(shù)據(jù)「一次性」寫(xiě)入磁盤(pán),其它時(shí)間都不需要操作磁盤(pán)。

基于這個(gè)方案,我們可以定時(shí)給 Redis 做數(shù)據(jù)快照,把數(shù)據(jù)持久化到磁盤(pán)上。

93609bdc-7b71-11eb-8b86-12bb97331649.jpg

其實(shí),上面說(shuō)的這些持久化方案,就是 Redis 的「RDB」和「AOF」:

RDB:只持久化某一時(shí)刻的數(shù)據(jù)快照到磁盤(pán)上(創(chuàng)建一個(gè)子進(jìn)程來(lái)做)

AOF:每一次寫(xiě)操作都持久到磁盤(pán)(主線程寫(xiě)內(nèi)存,根據(jù)策略可以配置由主線程還是子線程進(jìn)行數(shù)據(jù)持久化)

它們的區(qū)別除了上面講到的,還有以下特點(diǎn):

RDB 采用二進(jìn)制 + 數(shù)據(jù)壓縮的方式寫(xiě)磁盤(pán),這樣文件體積小,數(shù)據(jù)恢復(fù)速度也快

AOF 記錄的是每一次寫(xiě)命令,數(shù)據(jù)最全,但文件體積大,數(shù)據(jù)恢復(fù)速度慢

如果讓你來(lái)選擇持久化方案,你可以這樣選擇:

如果你的業(yè)務(wù)對(duì)于數(shù)據(jù)丟失不敏感,采用 RDB 方案持久化數(shù)據(jù)

如果你的業(yè)務(wù)對(duì)數(shù)據(jù)完整性要求比較高,采用 AOF 方案持久化數(shù)據(jù)

假設(shè)你的業(yè)務(wù)對(duì) Redis 數(shù)據(jù)完整性要求比較高,選擇了 AOF 方案,那此時(shí)你又會(huì)遇到這些問(wèn)題:

AOF 記錄每一次寫(xiě)操作,隨著時(shí)間增長(zhǎng),AOF 文件體積會(huì)越來(lái)越大

這么大的 AOF 文件,在數(shù)據(jù)恢復(fù)時(shí)變得非常慢

這怎么辦?數(shù)據(jù)完整性要求變高了,恢復(fù)數(shù)據(jù)也變困難了?有沒(méi)有什么方法,可以縮小文件體積?提升恢復(fù)速度呢?

我們繼續(xù)來(lái)分析 AOF 的特點(diǎn)。

由于 AOF 文件中記錄的都是每一次寫(xiě)操作,但對(duì)于同一個(gè) key 可能會(huì)發(fā)生多次修改,我們只保留最后一次被修改的值,是不是也可以?

是的,這就是我們經(jīng)常聽(tīng)到的「AOF rewrite」,你也可以把它理解為 AOF 「瘦身」。

我們可以對(duì) AOF 文件定時(shí) rewrite,避免這個(gè)文件體積持續(xù)膨脹,這樣在恢復(fù)時(shí)就可以縮短恢復(fù)時(shí)間了。

9386cd84-7b71-11eb-8b86-12bb97331649.jpg

再進(jìn)一步思考一下,還有沒(méi)有辦法繼續(xù)縮小 AOF 文件?

回顧一下我們前面講到的,RDB 和 AOF 各自的特點(diǎn):

RDB 以二進(jìn)制 + 數(shù)據(jù)壓縮方式存儲(chǔ),文件體積小

AOF 記錄每一次寫(xiě)命令,數(shù)據(jù)最全

我們可否利用它們各自的優(yōu)勢(shì)呢?

當(dāng)然可以,這就是 Redis 的「混合持久化」。

具體來(lái)說(shuō),當(dāng) AOF rewrite 時(shí),Redis 先以 RDB 格式在 AOF 文件中寫(xiě)入一個(gè)數(shù)據(jù)快照,再把在這期間產(chǎn)生的每一個(gè)寫(xiě)命令,追加到 AOF 文件中。因?yàn)?RDB 是二進(jìn)制壓縮寫(xiě)入的,這樣 AOF 文件體積就變得更小了。

93bc2038-7b71-11eb-8b86-12bb97331649.jpg

此時(shí),你在使用 AOF 文件恢復(fù)數(shù)據(jù)時(shí),這個(gè)恢復(fù)時(shí)間就會(huì)更短了!

Redis 4.0 以上版本才支持混合持久化。

這么一番優(yōu)化,你的 Redis 再也不用擔(dān)心實(shí)例宕機(jī)了,當(dāng)發(fā)生宕機(jī)時(shí),你就可以用持久化文件快速恢復(fù) Redis 中的數(shù)據(jù)。

但這樣就沒(méi)問(wèn)題了嗎?

仔細(xì)想一下,雖然我們已經(jīng)把持久化的文件優(yōu)化到最小了,但在恢復(fù)數(shù)據(jù)時(shí)依舊是需要時(shí)間的,在這期間你的業(yè)務(wù)應(yīng)用還是會(huì)受到影響,這怎么辦?

我們來(lái)分析有沒(méi)有更好的方案。

一個(gè)實(shí)例宕機(jī),只能用恢復(fù)數(shù)據(jù)來(lái)解決,那我們是否可以部署多個(gè) Redis 實(shí)例,然后讓這些實(shí)例數(shù)據(jù)保持實(shí)時(shí)同步,這樣當(dāng)一個(gè)實(shí)例宕機(jī)時(shí),我們?cè)谑O碌膶?shí)例中選擇一個(gè)繼續(xù)提供服務(wù)就好了。

沒(méi)錯(cuò),這個(gè)方案就是接下來(lái)要講的「主從復(fù)制:多副本」。

主從復(fù)制:多副本

此時(shí),你可以部署多個(gè) Redis 實(shí)例,架構(gòu)模型就變成了這樣:

93cb9a5e-7b71-11eb-8b86-12bb97331649.jpg

我們這里把實(shí)時(shí)讀寫(xiě)的節(jié)點(diǎn)叫做 master,另一個(gè)實(shí)時(shí)同步數(shù)據(jù)的節(jié)點(diǎn)叫做 slave。

采用多副本的方案,它的優(yōu)勢(shì)是:

縮短不可用時(shí)間:master 發(fā)生宕機(jī),我們可以手動(dòng)把 slave 提升為 master 繼續(xù)提供服務(wù)

提升讀性能:讓 slave 分擔(dān)一部分讀請(qǐng)求,提升應(yīng)用的整體性能

93e140f2-7b71-11eb-8b86-12bb97331649.jpg

這個(gè)方案不錯(cuò),不僅節(jié)省了數(shù)據(jù)恢復(fù)的時(shí)間,還能提升性能,那它有什么問(wèn)題嗎?

你可以思考一下。

其實(shí),它的問(wèn)題在于:當(dāng) master 宕機(jī)時(shí),我們需要「手動(dòng)」把 slave 提升為 master,這個(gè)過(guò)程也是需要花費(fèi)時(shí)間的。

雖然比恢復(fù)數(shù)據(jù)要快得多,但還是需要人工介入處理。一旦需要人工介入,就必須要算上人的反應(yīng)時(shí)間、操作時(shí)間,所以,在這期間你的業(yè)務(wù)應(yīng)用依舊會(huì)受到影響。

怎么解決這個(gè)問(wèn)題?我們是否可以把這個(gè)切換的過(guò)程,變成自動(dòng)化呢?

對(duì)于這種情況,我們需要一個(gè)「故障自動(dòng)切換」機(jī)制,這就是我們經(jīng)常聽(tīng)到的「哨兵」所具備的能力。

哨兵:故障自動(dòng)切換

現(xiàn)在,我們可以引入一個(gè)「觀察者」,讓這個(gè)觀察者去實(shí)時(shí)監(jiān)測(cè) master 的健康狀態(tài),這個(gè)觀察者就是「哨兵」。

具體如何做?

哨兵每間隔一段時(shí)間,詢問(wèn) master 是否正常

master 正?;貜?fù),表示狀態(tài)正常,回復(fù)超時(shí)表示異常

哨兵發(fā)現(xiàn)異常,發(fā)起主從切換

9409e584-7b71-11eb-8b86-12bb97331649.jpg

有了這個(gè)方案,就不需要人去介入處理了,一切就變得自動(dòng)化了,是不是很爽?

但這里還有一個(gè)問(wèn)題,如果 master 狀態(tài)正常,但這個(gè)哨兵在詢問(wèn) master 時(shí),它們之間的網(wǎng)絡(luò)發(fā)生了問(wèn)題,那這個(gè)哨兵可能會(huì)誤判。

94314b7e-7b71-11eb-8b86-12bb97331649.jpg

這個(gè)問(wèn)題怎么解決?

答案是,我們可以部署多個(gè)哨兵,讓它們分布在不同的機(jī)器上,它們一起監(jiān)測(cè) master 的狀態(tài),流程就變成了這樣:

多個(gè)哨兵每間隔一段時(shí)間,詢問(wèn) master 是否正常

master 正常回復(fù),表示狀態(tài)正常,回復(fù)超時(shí)表示異常

一旦有一個(gè)哨兵判定 master 異常(不管是否是網(wǎng)絡(luò)問(wèn)題),就詢問(wèn)其它哨兵,如果多個(gè)哨兵(設(shè)置一個(gè)閾值)都認(rèn)為 master 異常了,這才判定 master 確實(shí)發(fā)生了故障

多個(gè)哨兵經(jīng)過(guò)協(xié)商后,判定 master 故障,則發(fā)起主從切換

所以,我們用多個(gè)哨兵互相協(xié)商來(lái)判定 master 的狀態(tài),這樣一來(lái),就可以大大降低誤判的概率。

哨兵協(xié)商判定 master 異常后,這里還有一個(gè)問(wèn)題:由哪個(gè)哨兵來(lái)發(fā)起主從切換呢?

答案是,選出一個(gè)哨兵「領(lǐng)導(dǎo)者」,由這個(gè)領(lǐng)導(dǎo)者進(jìn)行主從切換。

問(wèn)題又來(lái)了,這個(gè)領(lǐng)導(dǎo)者怎么選?

想象一下,在現(xiàn)實(shí)生活中,選舉是怎么做的?

是的,投票。

在選舉哨兵領(lǐng)導(dǎo)者時(shí),我們可以制定這樣一個(gè)選舉規(guī)則:

每個(gè)哨兵都詢問(wèn)其它哨兵,請(qǐng)求對(duì)方為自己投票

每個(gè)哨兵只投票給第一個(gè)請(qǐng)求投票的哨兵,且只能投票一次

首先拿到超過(guò)半數(shù)投票的哨兵,當(dāng)選為領(lǐng)導(dǎo)者,發(fā)起主從切換

其實(shí),這個(gè)選舉的過(guò)程就是我們經(jīng)常聽(tīng)到的:分布式系統(tǒng)領(lǐng)域中的「共識(shí)算法」。

什么是共識(shí)算法?

我們?cè)诙鄠€(gè)機(jī)器部署哨兵,它們需要共同協(xié)作完成一項(xiàng)任務(wù),所以它們就組成了一個(gè)「分布式系統(tǒng)」。

在分布式系統(tǒng)領(lǐng)域,多個(gè)節(jié)點(diǎn)如何就一個(gè)問(wèn)題達(dá)成共識(shí)的算法,就叫共識(shí)算法。

在這個(gè)場(chǎng)景下,多個(gè)哨兵共同協(xié)商,選舉出一個(gè)都認(rèn)可的領(lǐng)導(dǎo)者,就是使用共識(shí)算法完成的。

這個(gè)算法還規(guī)定節(jié)點(diǎn)的數(shù)量必須是奇數(shù)個(gè),這樣可以保證系統(tǒng)中即使有節(jié)點(diǎn)發(fā)生了故障,剩余超過(guò)「半數(shù)」的節(jié)點(diǎn)狀態(tài)正常,依舊可以提供正確的結(jié)果,也就是說(shuō),這個(gè)算法還兼容了存在故障節(jié)點(diǎn)的情況。

共識(shí)算法在分布式系統(tǒng)領(lǐng)域有很多,例如 Paxos、Raft,哨兵選舉領(lǐng)導(dǎo)者這個(gè)場(chǎng)景,使用的是 Raft 共識(shí)算法,因?yàn)樗銐蚝?jiǎn)單,且易于實(shí)現(xiàn)。

現(xiàn)在,我們用多個(gè)哨兵共同監(jiān)測(cè) Redis 的狀態(tài),這樣一來(lái),就可以避免誤判的問(wèn)題了,架構(gòu)模型就變成了這樣:

945565fe-7b71-11eb-8b86-12bb97331649.jpg

好了,到這里我們先小結(jié)一下。

你的 Redis 從最簡(jiǎn)單的單機(jī)版,經(jīng)過(guò)數(shù)據(jù)持久化、主從多副本、哨兵集群,這一路優(yōu)化下來(lái),你的 Redis 不管是性能還是穩(wěn)定性,都越來(lái)越高,就算節(jié)點(diǎn)發(fā)生故障,也不用擔(dān)心了。

你的 Redis 以這樣的架構(gòu)模式部署,基本上就可以穩(wěn)定運(yùn)行很長(zhǎng)時(shí)間了。

...

隨著時(shí)間的發(fā)展,你的業(yè)務(wù)體量開(kāi)始迎來(lái)了爆炸性增長(zhǎng),此時(shí)你的架構(gòu)模型,還能夠承擔(dān)這么大的流量嗎?

我們一起來(lái)分析一下:

穩(wěn)定性:Redis 故障宕機(jī),我們有哨兵 + 副本,可以自動(dòng)完成主從切換

性能:讀請(qǐng)求量增長(zhǎng),我們可以再部署多個(gè) slave,讀寫(xiě)分離,分擔(dān)讀壓力

性能:寫(xiě)請(qǐng)求量增長(zhǎng),但我們只有一個(gè) master 實(shí)例,這個(gè)實(shí)例達(dá)到瓶頸怎么辦?

看到了么,當(dāng)你的寫(xiě)請(qǐng)求量越來(lái)越大時(shí),一個(gè) master 實(shí)例可能就無(wú)法承擔(dān)這么大的寫(xiě)流量了。

要想完美解決這個(gè)問(wèn)題,此時(shí)你就需要考慮使用「分片集群」了。

分片集群:橫向擴(kuò)展

什么是「分片集群」?

簡(jiǎn)單來(lái)講,一個(gè)實(shí)例扛不住寫(xiě)壓力,那我們是否可以部署多個(gè)實(shí)例,然后把這些實(shí)例按照一定規(guī)則組織起來(lái),把它們當(dāng)成一個(gè)整體,對(duì)外提供服務(wù),這樣不就可以解決集中寫(xiě)一個(gè)實(shí)例的瓶頸問(wèn)題嗎?

所以,現(xiàn)在的架構(gòu)模型就變成了這樣:

948195f2-7b71-11eb-8b86-12bb97331649.jpg

現(xiàn)在問(wèn)題又來(lái)了,這么多實(shí)例如何組織呢?

我們制定規(guī)則如下:

每個(gè)節(jié)點(diǎn)各自存儲(chǔ)一部分?jǐn)?shù)據(jù),所有節(jié)點(diǎn)數(shù)據(jù)之和才是全量數(shù)據(jù)

制定一個(gè)路由規(guī)則,對(duì)于不同的 key,把它路由到固定一個(gè)實(shí)例上進(jìn)行讀寫(xiě)

而分片集群根據(jù)路由規(guī)則所在位置的不同,還可以分為兩大類:

客戶端分片

服務(wù)端分片

客戶端分片指的是,key 的路由規(guī)則放在客戶端來(lái)做,就是下面這樣:

94a97e32-7b71-11eb-8b86-12bb97331649.jpg

這個(gè)方案的缺點(diǎn)是,客戶端需要維護(hù)這個(gè)路由規(guī)則,也就是說(shuō),你需要把路由規(guī)則寫(xiě)到你的業(yè)務(wù)代碼中。

如何做到不把路由規(guī)則耦合在業(yè)務(wù)代碼中呢?

你可以這樣優(yōu)化,把這個(gè)路由規(guī)則封裝成一個(gè)模塊,當(dāng)需要使用時(shí),集成這個(gè)模塊就可以了。

這就是 Redis Cluster 的采用的方案。

94c16a92-7b71-11eb-8b86-12bb97331649.jpg

Redis Cluster 內(nèi)置了哨兵邏輯,無(wú)需再部署哨兵。

當(dāng)你使用 Redis Cluster 時(shí),你的業(yè)務(wù)應(yīng)用需要使用配套的 Redis SDK,這個(gè) SDK 內(nèi)就集成好了路由規(guī)則,不需要你自己編寫(xiě)了。

再來(lái)看服務(wù)端分片。

這種方案指的是,路由規(guī)則不放在客戶端來(lái)做,而是在客戶端和服務(wù)端之間增加一個(gè)「中間代理層」,這個(gè)代理就是我們經(jīng)常聽(tīng)到的 Proxy。

而數(shù)據(jù)的路由規(guī)則,就放在這個(gè) Proxy 層來(lái)維護(hù)。

這樣一來(lái),你就無(wú)需關(guān)心服務(wù)端有多少個(gè) Redis 節(jié)點(diǎn)了,只需要和這個(gè) Proxy 交互即可。

Proxy 會(huì)把你的請(qǐng)求根據(jù)路由規(guī)則,轉(zhuǎn)發(fā)到對(duì)應(yīng)的 Redis 節(jié)點(diǎn)上,而且,當(dāng)集群實(shí)例不足以支撐更大的流量請(qǐng)求時(shí),還可以橫向擴(kuò)容,添加新的 Redis 實(shí)例提升性能,這一切對(duì)于你的客戶端來(lái)說(shuō),都是透明無(wú)感知的。

業(yè)界開(kāi)源的 Redis 分片集群方案,例如 Twemproxy、Codis 就是采用的這種方案。

94e92352-7b71-11eb-8b86-12bb97331649.jpg

分片集群在數(shù)據(jù)擴(kuò)容時(shí),還涉及到了很多細(xì)節(jié),這塊內(nèi)容不是本文章重點(diǎn),所以暫不詳述。

至此,當(dāng)你使用分片集群后,對(duì)于未來(lái)更大的流量壓力,都可以從容面對(duì)了!

總結(jié)

好了,我們來(lái)總結(jié)一下,我們是如何一步步構(gòu)建一個(gè)穩(wěn)定、高性能的 Redis 集群的。

首先,在使用最簡(jiǎn)單的單機(jī)版 Redis 時(shí),我們發(fā)現(xiàn)當(dāng) Redis 故障宕機(jī)后,數(shù)據(jù)無(wú)法恢復(fù)的問(wèn)題,因此我們想到了「數(shù)據(jù)持久化」,把內(nèi)存中的數(shù)據(jù)也持久化到磁盤(pán)上一份,這樣 Redis 重啟后就可以從磁盤(pán)上快速恢復(fù)數(shù)據(jù)。

在進(jìn)行數(shù)據(jù)持久化時(shí),我們又面臨如何更高效地將數(shù)據(jù)持久化到磁盤(pán)的問(wèn)題。之后我們發(fā)現(xiàn) Redis 提供了 RDB 和 AOF 兩種方案,分別對(duì)應(yīng)了數(shù)據(jù)快照和實(shí)時(shí)的命令記錄。當(dāng)我們對(duì)數(shù)據(jù)完整性要求不高時(shí),可以選擇 RDB 持久化方案。如果對(duì)于數(shù)據(jù)完整性要求較高,那么可以選擇 AOF 持久化方案。

但是我們又發(fā)現(xiàn),AOF 文件體積會(huì)隨著時(shí)間增長(zhǎng)變得越來(lái)越大,此時(shí)我們想到的優(yōu)化方案是,使用 AOF rewrite 的方式對(duì)其進(jìn)行瘦身,減小文件體積,再后來(lái),我們發(fā)現(xiàn)可以結(jié)合 RDB 和 AOF 各自的優(yōu)勢(shì),在 AOF rewrite 時(shí)使用兩者結(jié)合的「混合持久化」方式,又進(jìn)一步減小了 AOF 文件體積。

之后,我們發(fā)現(xiàn)盡管可以通過(guò)數(shù)據(jù)恢復(fù)的方式還原數(shù)據(jù),但恢復(fù)數(shù)據(jù)也是需要花費(fèi)時(shí)間的,這意味著業(yè)務(wù)應(yīng)用還是會(huì)受到影響。我們進(jìn)一步優(yōu)化,采用「多副本」的方案,讓多個(gè)實(shí)例保持實(shí)時(shí)同步,當(dāng)一個(gè)實(shí)例故障時(shí),可以手動(dòng)把其它實(shí)例提升上來(lái)繼續(xù)提供服務(wù)。

但是這樣也有問(wèn)題,手動(dòng)提升實(shí)例上來(lái),需要人工介入,人工介入操作也需要時(shí)間,我們開(kāi)始想辦法把這個(gè)流程變得自動(dòng)化,所以我們又引入了「哨兵」集群,哨兵集群通過(guò)互相協(xié)商的方式,發(fā)現(xiàn)故障節(jié)點(diǎn),并可以自動(dòng)完成切換,這樣就大幅降低了對(duì)業(yè)務(wù)應(yīng)用的影響。

最后,我們把關(guān)注點(diǎn)聚焦在如何支撐更大的寫(xiě)流量上,所以,我們又引入了「分片集群」來(lái)解決這個(gè)問(wèn)題,讓多個(gè) Redis 實(shí)例分?jǐn)倢?xiě)壓力,未來(lái)面對(duì)更大的流量,我們還可以添加新的實(shí)例,橫向擴(kuò)展,進(jìn)一步提升集群的性能。

至此,我們的 Redis 集群才得以長(zhǎng)期穩(wěn)定、高性能的為我們的業(yè)務(wù)提供服務(wù)。

這里我畫(huà)了一個(gè)思維導(dǎo)圖,方便你更好地去理解它們之間的關(guān)系,以及演化的過(guò)程。

后記

看到這里,我想你對(duì)如何構(gòu)建一個(gè)穩(wěn)定、高性能的 Redis 集群?jiǎn)栴}時(shí),應(yīng)該會(huì)有自己的見(jiàn)解了。

其實(shí),這篇文章所講的優(yōu)化思路,圍繞的主題就是「架構(gòu)設(shè)計(jì)」的核心思想:

高性能:讀寫(xiě)分離、分片集群

高可用:數(shù)據(jù)持久化、多副本、故障自動(dòng)切換

易擴(kuò)展:分片集群、橫向擴(kuò)展

當(dāng)我們講到哨兵集群、分片集群時(shí),這還涉及到了「分布式系統(tǒng)」相關(guān)的知識(shí):

分布式共識(shí):哨兵領(lǐng)導(dǎo)者選舉

負(fù)載均衡:分片集群數(shù)據(jù)分片、數(shù)據(jù)路由

當(dāng)然,除了 Redis 之外,對(duì)于構(gòu)建任何一個(gè)數(shù)據(jù)集群,你都可以沿用這個(gè)思路去思考、去優(yōu)化,看看它們到底是如何做的。

例如當(dāng)你在使用 MySQL 時(shí),你可以思考一下 MySQL 與 Redis 有哪些不同?MySQL 為了做到高性能、高可用,又是如何做的?其實(shí)思路都是類似的。

我們現(xiàn)在到處可見(jiàn)分布式系統(tǒng)、數(shù)據(jù)集群,我希望通過(guò)這篇文章,你可以理解這些軟件是如何一步步演化過(guò)來(lái)的,在演化過(guò)程中,它們遇到了哪些問(wèn)題,為了解決這些問(wèn)題,這些軟件的設(shè)計(jì)者設(shè)計(jì)了怎樣的方案,做了哪些取舍?

你只有了解了其中的原理,掌握了分析問(wèn)題、解決問(wèn)題的能力,這樣在以后的開(kāi)發(fā)過(guò)程中,或是學(xué)習(xí)其它優(yōu)秀軟件時(shí),就能快速地找到「重點(diǎn)」,在最短的時(shí)間掌握它,并能在實(shí)際應(yīng)用中發(fā)揮它們的優(yōu)勢(shì)。

其實(shí)這個(gè)思考過(guò)程,也是做「架構(gòu)設(shè)計(jì)」的思路。在做軟件架構(gòu)設(shè)計(jì)時(shí),你面臨的場(chǎng)景就是發(fā)現(xiàn)問(wèn)題、分析問(wèn)題、解決問(wèn)題,一步步去演化、升級(jí)你的架構(gòu),最后在性能、可靠性方面達(dá)到一個(gè)平衡。雖然各種軟件層出不窮,但架構(gòu)設(shè)計(jì)的思想不會(huì)變,我希望你真正吸收的是這些思想,這樣才可以做到以不變應(yīng)萬(wàn)變。

原文標(biāo)題:如何從0到1構(gòu)建一個(gè)穩(wěn)定、高性能的 Redis 集群?(附16張圖解)

文章出處:【微信公眾號(hào):數(shù)據(jù)分析與開(kāi)發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    6715

    瀏覽量

    88308
  • Redis
    +關(guān)注

    關(guān)注

    0

    文章

    368

    瀏覽量

    10780

原文標(biāo)題:如何從0到1構(gòu)建一個(gè)穩(wěn)定、高性能的 Redis 集群?(附16張圖解)

文章出處:【微信號(hào):DBDevs,微信公眾號(hào):數(shù)據(jù)分析與開(kāi)發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    K8S學(xué)習(xí)教程(二):在 PetaExpress KubeSphere容器平臺(tái)部署高可用 Redis 集群

    前言 Redis 是在開(kāi)發(fā)過(guò)程中經(jīng)常用到的緩存中間件,為了考慮在生產(chǎn)環(huán)境中穩(wěn)定性和高可用,Redis通常采用集群模式的部署方式。 在制定Redis
    的頭像 發(fā)表于 07-03 15:30 ?360次閱讀
    K8S學(xué)習(xí)教程(二):在 PetaExpress KubeSphere容器平臺(tái)部署高可用 <b class='flag-5'>Redis</b> <b class='flag-5'>集群</b>

    高性能計(jì)算集群的能耗優(yōu)化

    高性能計(jì)算(HighPerformanceComputing,HPC)是指利用大規(guī)模并行計(jì)算機(jī)集群來(lái)解決復(fù)雜的科學(xué)和工程問(wèn)題的技術(shù)。高性能計(jì)算集群的應(yīng)用領(lǐng)域非常廣泛,包括天氣預(yù)報(bào)、生物
    的頭像 發(fā)表于 05-25 08:27 ?231次閱讀
    <b class='flag-5'>高性能</b>計(jì)算<b class='flag-5'>集群</b>的能耗優(yōu)化

    Redis為L(zhǎng)angChain定制AI代理——OpenGPTs

    OpenAI最近推出了OpenAIGPTs——個(gè)構(gòu)建定制化AI代理的無(wú)代碼“應(yīng)用商店”,隨后LangChain開(kāi)發(fā)了類似的開(kāi)源工具OpenGPTs。OpenGPTs是款低代碼的開(kāi)源
    的頭像 發(fā)表于 01-13 08:03 ?732次閱讀
    用<b class='flag-5'>Redis</b>為L(zhǎng)angChain定制AI代理——OpenGPTs

    【昉·星光 2 高性能RISC-V單板計(jì)算機(jī)體驗(yàn)】Redis源碼編譯和性能測(cè)試以及與樹(shù)莓派4B對(duì)比

    版本的Redis服務(wù)和Redis基準(zhǔn)測(cè)試。測(cè)試結(jié)果顯示,VisionFive2上Redis性能明顯由于樹(shù)莓派4B,這定程度上說(shuō)明——Vis
    發(fā)表于 12-10 21:27

    redis是關(guān)系型數(shù)據(jù)庫(kù)嗎

    Server)是個(gè)開(kāi)源的高性能鍵值對(duì)存儲(chǔ)系統(tǒng)。它使用C語(yǔ)言編寫(xiě),具有內(nèi)存中數(shù)據(jù)存儲(chǔ)和持久化到硬盤(pán)的功能。Redis支持多種數(shù)據(jù)結(jié)構(gòu),如字符串、哈希表、列表、集合和有序集合等,這使得
    的頭像 發(fā)表于 12-05 10:32 ?1225次閱讀

    redis的主要方法

    Redis種基于內(nèi)存的開(kāi)源鍵值對(duì)存儲(chǔ)系統(tǒng),常用于緩存、消息中間件、數(shù)據(jù)庫(kù)等場(chǎng)景。作為個(gè)高性能的NoSQL存儲(chǔ)解決方案,
    的頭像 發(fā)表于 12-05 09:59 ?690次閱讀

    redis的原理和使用場(chǎng)景

    Redis(Remote Dictionary Server)是個(gè)開(kāi)源的、高性能的非關(guān)系型(NoSQL)的鍵值對(duì)數(shù)據(jù)庫(kù)管理系統(tǒng)。它以其快速讀寫(xiě)能力和多種數(shù)據(jù)結(jié)構(gòu)支持而聞名,并被廣泛應(yīng)
    的頭像 發(fā)表于 12-04 16:29 ?487次閱讀

    redis的持久化方式RDB和AOF的區(qū)別

    Redis個(gè)高性能的鍵值對(duì)數(shù)據(jù)庫(kù),提供了兩種持久化方式:RDB 和 AOF。RDB 是將 Redis 的數(shù)據(jù)快照保存到磁盤(pán)上,而 AO
    的頭像 發(fā)表于 12-04 16:25 ?606次閱讀

    redis的哨兵和集群有什么區(qū)別

    Redis個(gè)開(kāi)源的內(nèi)存數(shù)據(jù)庫(kù),被廣泛用于構(gòu)建高性能和可擴(kuò)展的應(yīng)用程序。在使用Redis時(shí),有
    的頭像 發(fā)表于 12-04 14:53 ?2645次閱讀

    redis查看集群狀態(tài)命令

    Redis個(gè)開(kāi)源的、內(nèi)存中的數(shù)據(jù)結(jié)構(gòu)存儲(chǔ)系統(tǒng),提供了系列命令來(lái)管理和操作數(shù)據(jù)。在 Redis 中,
    的頭像 發(fā)表于 12-04 11:39 ?843次閱讀

    redis集群性能測(cè)試工具有哪些

    Redis高性能的內(nèi)存鍵值存儲(chǔ)系統(tǒng),它被廣泛應(yīng)用于各種互聯(lián)網(wǎng)應(yīng)用和大規(guī)模的數(shù)據(jù)存儲(chǔ)中。為了評(píng)估Redis在不同場(chǎng)景下的性能,我們需要使
    的頭像 發(fā)表于 12-04 11:36 ?601次閱讀

    redis連接數(shù)對(duì)性能測(cè)試影響

    Redis個(gè)基于內(nèi)存的鍵值存儲(chǔ)數(shù)據(jù)庫(kù),它以其高性能和低延遲而聞名。在使用Redis進(jìn)行性能測(cè)
    的頭像 發(fā)表于 12-04 11:33 ?811次閱讀

    redis集群中的hash致性算法的理解

    Redis集群種為了增強(qiáng)Redis的可擴(kuò)展性和高可用性而設(shè)計(jì)的集群方案。在Redis
    的頭像 發(fā)表于 12-04 10:45 ?626次閱讀

    redis集群狀態(tài)查看命令

    Redis集群種高可用性的分布式架構(gòu),可以通過(guò)多個(gè)節(jié)點(diǎn)實(shí)現(xiàn)數(shù)據(jù)的復(fù)制和負(fù)載均衡。為了維護(hù)集群穩(wěn)定性和可靠性,管理員需要監(jiān)控和查看
    的頭像 發(fā)表于 12-04 10:44 ?1022次閱讀

    redis與mysql如何保持?jǐn)?shù)據(jù)致性

    Redis款開(kāi)源的高性能Key-Value存儲(chǔ)系統(tǒng),通常被用作緩存和數(shù)據(jù)存儲(chǔ)。它支持多種數(shù)據(jù)結(jié)構(gòu),并提供了豐富的功能,如事務(wù)、發(fā)布訂閱、Lua腳本等。Redis的內(nèi)存數(shù)據(jù)庫(kù)特性使
    的頭像 發(fā)表于 11-16 11:27 ?807次閱讀