初識(shí)華為云數(shù)據(jù)庫(kù)GaussDB(for Cassandra
“l(fā)ocal quorum查詢某個(gè)分區(qū)鍵的條數(shù),每次查詢,條數(shù)都不一樣?!?/p>
“按這個(gè)分區(qū)鍵的token修復(fù),直接瞬間修復(fù)結(jié)束。但是再查,還是每次查詢條數(shù)不一致?!?/p>
“之前遇到墓碑丟失的問(wèn)題,單個(gè)token查詢結(jié)果不一致,修復(fù)也解決不了”
…..
不用再為數(shù)據(jù)不一致苦惱,因?yàn)閺?qiáng)一致的Cassandra來(lái)了,DBA們不用加班修數(shù)據(jù)了。
GaussDB(for Cassandra)是一款基于華為自主研發(fā)的計(jì)算存儲(chǔ)分離架構(gòu)的分布式云數(shù)據(jù)庫(kù)服務(wù)。是一個(gè)強(qiáng)一致性的系統(tǒng),在華為云高性能、高可用、高可靠、高安全、可彈性伸縮的基礎(chǔ)上,提供了一鍵部署、備份恢復(fù)、監(jiān)控報(bào)警等服務(wù)能力。高度兼容開(kāi)源Cassandra接口,并提供高讀寫(xiě)性能,具有高性價(jià)比,適用于IoT、氣象、互聯(lián)網(wǎng)、游戲等領(lǐng)域。
本文將從架構(gòu)、主要特性、競(jìng)爭(zhēng)力、應(yīng)用場(chǎng)景等方面進(jìn)行介紹。
設(shè)計(jì)架構(gòu):
GaussDB(for Cassandra)基于計(jì)算存儲(chǔ)分離架構(gòu),該架構(gòu)基于華為內(nèi)部強(qiáng)大且廣泛使用的自研分布式存儲(chǔ)系統(tǒng)DFV(數(shù)據(jù)功能虛擬化/Data Function Virtualisation),實(shí)現(xiàn)了一套Share Everything的云開(kāi)源架構(gòu),充分發(fā)揮了云開(kāi)源的彈性伸縮、資源共享的優(yōu)勢(shì),高度兼容Cassandra協(xié)議,擁有超強(qiáng)寫(xiě)入性能,同時(shí)相比社區(qū)版具有分鐘級(jí)計(jì)算擴(kuò)容、秒級(jí)存儲(chǔ)擴(kuò)容、數(shù)據(jù)強(qiáng)一致等優(yōu)勢(shì),性能更強(qiáng)更穩(wěn)定,數(shù)據(jù)更可靠,擴(kuò)容更敏捷,適用于IoT、實(shí)時(shí)推薦、金融反欺詐檢測(cè)等場(chǎng)景。
GaussDB(for Cassandra)牛在哪?
高可靠:數(shù)據(jù)強(qiáng)一致,提供企業(yè)級(jí)數(shù)據(jù)可靠性
開(kāi)源Cassandra讀寫(xiě)數(shù)據(jù)采用最終一致性,此處用讀場(chǎng)景舉例:如果讀一致性要求為ONE,會(huì)立即返回離客戶端最近的一份數(shù)據(jù)副本,那么這意味著第一次讀取到的數(shù)據(jù)可能不是最新的數(shù)據(jù)。如果讀一致性要求為QUORUM(即讀取任一數(shù)據(jù)中心中quorum數(shù)量的節(jié)點(diǎn)的結(jié)果,返回合并后timestamp最新的結(jié)果),則內(nèi)核會(huì)自動(dòng)觸發(fā)讀修復(fù),然后返回給客戶端。假如此時(shí)有副本所在節(jié)點(diǎn)出現(xiàn)壞盤,在gc_graces的周期內(nèi)沒(méi)有完成數(shù)據(jù)修復(fù),部分副本屬于壞盤節(jié)點(diǎn)的業(yè)務(wù)數(shù)據(jù),業(yè)務(wù)查詢過(guò)程中發(fā)現(xiàn)數(shù)據(jù)會(huì)概率性不正確。
GaussDB(for Cassandra)采用存算分離架構(gòu),數(shù)據(jù)的副本在DFV存儲(chǔ)平臺(tái)保證,對(duì)計(jì)算節(jié)點(diǎn)來(lái)說(shuō)數(shù)據(jù)單副本、數(shù)據(jù)強(qiáng)一致,查詢只需要從協(xié)調(diào)節(jié)點(diǎn)直接到數(shù)據(jù)節(jié)點(diǎn)取數(shù)據(jù)即可完成,規(guī)避了數(shù)據(jù)不一致修復(fù)數(shù)據(jù)造成的人力成本、業(yè)務(wù)查詢過(guò)程中發(fā)現(xiàn)數(shù)據(jù)會(huì)概率性不正確等問(wèn)題。另外支持N-1個(gè)節(jié)點(diǎn)故障容忍,提供10倍以上的故障重構(gòu)性能和備份恢復(fù)性能,保證數(shù)據(jù)的可靠性。
高擴(kuò)展:秒級(jí)擴(kuò)容,快速更神速
開(kāi)源Cassandra采用一致性Hash算法對(duì)數(shù)據(jù)進(jìn)行分區(qū)打散,整個(gè)環(huán)代表數(shù)據(jù)從負(fù)無(wú)窮到正無(wú)窮區(qū)間。集群中每個(gè)節(jié)點(diǎn)會(huì)有虛擬節(jié)點(diǎn)(Token)在環(huán)上,虛擬節(jié)點(diǎn)的數(shù)量可配置。黃圈代表節(jié)點(diǎn)1,藍(lán)圈代表要擴(kuò)容的節(jié)點(diǎn)2,2個(gè)Token之間組成整個(gè)數(shù)據(jù)的其中一段Range區(qū)間,擴(kuò)容后加入了新的Token,會(huì)產(chǎn)生新的Range,這些Range中的一部分會(huì)歸新節(jié)點(diǎn)2管理。那么就需要把數(shù)據(jù)從節(jié)點(diǎn)1遷移到新節(jié)點(diǎn)2上去。遷移是通過(guò)讀取節(jié)點(diǎn)1上的數(shù)據(jù)寫(xiě)入到節(jié)點(diǎn)2上,遷移的速度可以通過(guò)配置參數(shù)調(diào)整,整體遷移的時(shí)間由數(shù)據(jù)量與遷移過(guò)程中的讀寫(xiě)速率有關(guān)。
GaussDB(for Cassandra)把多副本策略下沉到共享存儲(chǔ),大幅提升彈性伸縮能力,如圖右側(cè)展示,新擴(kuò)容的節(jié)點(diǎn)2只需要重新映射Token2到節(jié)點(diǎn)2,就可以完成,無(wú)需做數(shù)據(jù)的讀取與寫(xiě)入的搬遷動(dòng)作,實(shí)現(xiàn)分鐘級(jí)計(jì)算擴(kuò)容,相比開(kāi)源擴(kuò)容時(shí)間提升幾十倍。隨著業(yè)務(wù)的不斷增長(zhǎng),Cassandra可以分鐘級(jí)水平彈性資源擴(kuò)展。在類似圣誕節(jié)等熱門節(jié)日,提前1天進(jìn)行彈性擴(kuò)容,為業(yè)務(wù)高峰預(yù)留資源,業(yè)務(wù)高峰過(guò)后進(jìn)行縮容,這些對(duì)業(yè)務(wù)無(wú)感知。計(jì)算節(jié)點(diǎn)可以通過(guò)文件系統(tǒng)控制集群在DFV中的數(shù)據(jù)使用量,擴(kuò)容縮容磁盤時(shí)通過(guò)重新分配最大使用量,可實(shí)現(xiàn)秒級(jí)存儲(chǔ)擴(kuò)容,單實(shí)例支持海量數(shù)據(jù)存儲(chǔ)。
高性能:超高寫(xiě)入,讀性能數(shù)倍提升
GaussDB(for Cassandra)在超強(qiáng)寫(xiě)入性能的基礎(chǔ)上,通過(guò)使用C語(yǔ)言重構(gòu)存儲(chǔ)引擎,減少系統(tǒng)GC,實(shí)現(xiàn)了數(shù)倍讀性能提升,拓寬了使用場(chǎng)景的外延,使其不僅僅適用于寫(xiě)密集型的業(yè)務(wù)場(chǎng)景,在讀密集的場(chǎng)景中也具備了強(qiáng)競(jìng)爭(zhēng)優(yōu)勢(shì),整體性能超越開(kāi)源自建2~3倍。
高安全:構(gòu)筑多層保護(hù),為數(shù)據(jù)安全保駕護(hù)航
GaussDB(for Cassandra)通過(guò)VPC、子網(wǎng)、安全組、DDoS防護(hù)以及SSL安全訪問(wèn)等多層安全防護(hù)體系,幫助用戶抵御網(wǎng)絡(luò)攻擊,讓用戶上云無(wú)憂。
為什么選擇GaussDB(for Cassandra)?
能力
技術(shù)能力對(duì)比
開(kāi)源自建Cassandra
GaussDB(for Cassandra)
自動(dòng)備份能力、PITR
×
√
超大數(shù)據(jù)量及復(fù)雜查詢支持
×
√
流表(數(shù)據(jù)變更捕獲)
×
√
離線分析
不完善
√
高可靠:雙向數(shù)據(jù)同步、無(wú)損升級(jí)
×
√
分鐘級(jí)擴(kuò)容
×
√
全局索引
不完善
√
數(shù)據(jù)強(qiáng)一致
×
√
適用多種場(chǎng)景
工業(yè)制造&氣象業(yè)
隨著科技進(jìn)度,采集的氣象數(shù)據(jù)指數(shù)增長(zhǎng),需要一種系統(tǒng)對(duì)地面、高空、海洋、重要天氣報(bào)、閃電、環(huán)境監(jiān)測(cè)等衛(wèi)星、雷達(dá)采集的數(shù)據(jù)能夠高性能寫(xiě)入、查詢、在線、離線分析。
1.需要存儲(chǔ)對(duì)地面、高空、海洋、重要天氣報(bào)、閃電、環(huán)境監(jiān)測(cè)等衛(wèi)星、雷達(dá)等降雨量、濕度、溫度等PB級(jí)數(shù)據(jù)量
2.支撐來(lái)自各氣象采集點(diǎn)數(shù)據(jù)高并發(fā)寫(xiě)入到Cassandra,GaussDB(for Cassandra)集群性能高于自建2~3倍,更適合高并發(fā)寫(xiě)入讀取
3.GaussDB(for Cassandra)數(shù)據(jù)能夠支撐實(shí)時(shí)在線分析,為氣象算法、天氣預(yù)報(bào)做到實(shí)時(shí)精準(zhǔn)分析
4.訪問(wèn)數(shù)據(jù)庫(kù)進(jìn)行離線數(shù)據(jù)分析,GaussDB(for Cassandra)能將離線分析時(shí)效縮短到60%
互聯(lián)網(wǎng)
GaussDB(for Cassandra)具備高并發(fā)寫(xiě)入性能和高可擴(kuò)展性,保障集群高可用和業(yè)務(wù)連續(xù)穩(wěn)定性,非常適用于寫(xiě)入規(guī)模量較大的互聯(lián)網(wǎng)大數(shù)據(jù)場(chǎng)景,如記錄大規(guī)模的用戶行為數(shù)據(jù)等。
1.存放用戶畫(huà)像數(shù)據(jù),能夠完美解決特征:數(shù)據(jù)量大、可以應(yīng)對(duì)數(shù)據(jù)結(jié)構(gòu)Scheme頻繁變更
2.查詢性能要求高;比如要買一雙鞋,搜索出的鞋子數(shù)據(jù)會(huì)根據(jù)用戶畫(huà)像的特征做一定的排序展示,那么要求查詢用戶特征表的查詢性能非常高
3.推薦系統(tǒng):根據(jù)用戶最近瀏覽的數(shù)據(jù)做分析之后,推薦相關(guān)資源給用戶
4.點(diǎn)贊系統(tǒng):點(diǎn)贊計(jì)數(shù)系統(tǒng)
實(shí)時(shí)數(shù)據(jù)分析場(chǎng)景
GaussDB(for Cassandra)群組今天新來(lái)了一個(gè)成員,或者yutou今天發(fā)布一篇新文章,華為云數(shù)據(jù)庫(kù)官方自動(dòng)向該用戶發(fā)出歡迎郵件。
昵稱為yutou的同學(xué)今天發(fā)布了一組新照片,那么另外一個(gè)程序自動(dòng)向yutou的好友發(fā)送通知。
原生不具備的數(shù)據(jù)變更捕獲能力,GaussDB(for Cassandra)具有變更捕獲能力,能對(duì)數(shù)據(jù)的變更做實(shí)時(shí)在線分析,提供秒級(jí)的實(shí)時(shí)推送動(dòng)作做出相應(yīng)處理;具有完善的離線分析解決方案,可以將離線分析時(shí)效縮短到60%,為商家爭(zhēng)取更多的時(shí)間做出相應(yīng)決策。
購(gòu)買建議
GaussDB(for Cassandra)性能為開(kāi)源2倍以上,存儲(chǔ)空間僅需開(kāi)源自建1/3,幫助客戶節(jié)省成本,舉例如下:開(kāi)源自建8u32g * 3節(jié)點(diǎn) 數(shù)據(jù)量:90G(三副本),購(gòu)買GaussDB(for Cassandra)可選擇創(chuàng)建4u16g * 3節(jié)點(diǎn) 數(shù)據(jù)量:30G(DFV存儲(chǔ)三副本)。
審核編輯 黃昊宇
-
華為云
+關(guān)注
關(guān)注
3文章
2391瀏覽量
17248
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論