0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

現(xiàn)代化的數(shù)據(jù)管理平臺(tái)的性能

高端存儲(chǔ)知識(shí) ? 來源:高端存儲(chǔ)知識(shí) ? 作者:高端存儲(chǔ)知識(shí) ? 2022-11-03 09:39 ? 次閱讀

今年9月8日,愛數(shù)AnyBackup神盾會(huì)(七)上首次劇透了AnyBackup Family 8,并正式亮相了AnyBackup Family 8的核心技術(shù)架構(gòu)——備份數(shù)據(jù)湖。

c2874e06-5b12-11ed-a3b6-dac502259ad0.png

備份數(shù)據(jù)湖的概念不難理解,類似國外提到的第二存儲(chǔ)理念,即把備份系統(tǒng)和數(shù)據(jù)湖系統(tǒng)合二為一。備份數(shù)據(jù)湖提供數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)管理和數(shù)據(jù)服務(wù)三大能力,除了支撐傳統(tǒng)的災(zāi)難恢復(fù)、備份數(shù)據(jù)資產(chǎn)管理類應(yīng)用外,還支持測試數(shù)據(jù)管理和數(shù)據(jù)科學(xué)類應(yīng)用,有效降低企業(yè)在數(shù)據(jù)管理方面的TCO,提高企業(yè)數(shù)據(jù)的利用率,充分挖掘企業(yè)數(shù)據(jù)的價(jià)值。

但是,AnyBackup Family 8如此龐大和復(fù)雜的系統(tǒng),功能已經(jīng)完全超越了傳統(tǒng)備份,對性能的要求也必須與時(shí)俱進(jìn),否則上面的理念都變?yōu)榭照?。比如你從上面拉起一個(gè)數(shù)據(jù)庫副本進(jìn)行開發(fā)測試,性能比生產(chǎn)系統(tǒng)慢非常多,會(huì)大大影響企業(yè)的開發(fā)速度,造成人力的極大浪費(fèi),這樣的備份數(shù)據(jù)湖也就沒有什么實(shí)用價(jià)值。

愛數(shù)也了解大家的困惑,因此在10月27日下午,舉辦了以“性能爆表”為主題的神盾會(huì)(八),延續(xù)上一次神盾會(huì),繼續(xù)對神秘的AnyBackup Family 8進(jìn)行劇透,展示AnyBackup Family 8領(lǐng)先技術(shù)的性能表現(xiàn)。

整體的會(huì)議內(nèi)容很充實(shí),從現(xiàn)代化數(shù)據(jù)管理平臺(tái)“性能觀”的思想碰撞,到火力全開、性能爆表的炸裂表現(xiàn),再到超能打領(lǐng)先技術(shù)分享,非常值得一看。

西瓜哥作為多年存儲(chǔ)從業(yè)人員,可謂閱存儲(chǔ)無數(shù),還是發(fā)現(xiàn)這個(gè)神盾會(huì)有很多技術(shù)干貨,對專業(yè)的存儲(chǔ)人士來說也非常有啟發(fā),因此,這次我就來解讀一下其中的技術(shù)干貨。

愛數(shù)的“性能觀”

愛數(shù)認(rèn)為,現(xiàn)代化的數(shù)據(jù)管理平臺(tái)的性能是一個(gè)綜合的指標(biāo),和相關(guān)的生產(chǎn)系統(tǒng)、傳輸網(wǎng)絡(luò)都密切相關(guān)。

c2c41c14-5b12-11ed-a3b6-dac502259ad0.png

而性能的提升,也需要從硬件和軟件兩個(gè)方面努力。這次的會(huì)議,主要聚焦在AnyBackup Family 8在軟件scale-out能力提升方面。

總體思路:和應(yīng)用集成設(shè)計(jì)

首先,愛數(shù)認(rèn)為,備份軟件+分布式存儲(chǔ)≠分布式備份系統(tǒng)。

c2ef9394-5b12-11ed-a3b6-dac502259ad0.png

這個(gè)其實(shí)不難理解,因?yàn)閭浞菹到y(tǒng)本身沒有分布式化,很多部件都不是分布式設(shè)計(jì)的。比如Media不能跨節(jié)點(diǎn),單個(gè)節(jié)點(diǎn)依然是性能瓶頸;Media中轉(zhuǎn)文件系統(tǒng),性能損耗大,無法跑滿磁盤帶寬;單個(gè)節(jié)點(diǎn)提供Index,巨型應(yīng)用索引是瓶頸。

因此,AnyBackup Family 8把備份系統(tǒng)和分布式存儲(chǔ)集成在一起設(shè)計(jì),是一種集成系統(tǒng)的思路。AnyBackup Family 8通過三副本的存儲(chǔ)池、NVMe分布式緩存、兼具快照系統(tǒng)和各類數(shù)據(jù)結(jié)構(gòu)化服務(wù)的數(shù)據(jù)引擎服務(wù)、高性能客戶端和協(xié)議網(wǎng)關(guān),構(gòu)建的分布式存儲(chǔ)架構(gòu),全力打造超高性能,即使在海量數(shù)據(jù)場景下,依然表現(xiàn)優(yōu)異。

c317689c-5b12-11ed-a3b6-dac502259ad0.png

和業(yè)界的通用存儲(chǔ)不同,AnyBackup Family 8特別清楚自己的定位,其優(yōu)化思路和ORACLE數(shù)據(jù)庫一體機(jī)類似,讓存儲(chǔ)在特定的應(yīng)用場景下性能最優(yōu)。

存儲(chǔ)池采用三副本,而不是EC(糾刪碼)。這種做法類似Nutanix等很多超融合廠商,采用三副本,可以讓應(yīng)用直接感知副本的存儲(chǔ)位置,能夠大大提升數(shù)據(jù)的存取速度。

協(xié)議網(wǎng)關(guān)除了支撐通用的存儲(chǔ)協(xié)議,還支持專用的備份恢復(fù)客戶端。這種做法類似很多高性能文件系統(tǒng),通過專用客戶端來提升單客戶端的性能。

在備份系統(tǒng)的分布式化上,愛數(shù)采用全分布式的設(shè)計(jì)思路。分布式索引服務(wù)、分布式數(shù)據(jù)服務(wù)、分布式元數(shù)據(jù)服務(wù)、分布式搜索服務(wù),再加上底層分布式快照服務(wù),可以提供無限快照能力,讓所有可能成為性能瓶頸的部件全部都支持scale-out線性擴(kuò)展,從架構(gòu)上徹底解決性能問題。

下面我們來展開看看,AnyBackup Family 8的幾個(gè)性能提升設(shè)計(jì)思路。

索引拆分和分布式化

c349ab72-5b12-11ed-a3b6-dac502259ad0.png

愛數(shù)第一件事就是在索引庫引入快照機(jī)制,每次增量備份完成就做一個(gè)快照,全量備份就產(chǎn)生一個(gè)新的索引。這樣做的好處就是每個(gè)時(shí)間點(diǎn)都有一個(gè)獨(dú)立完整的索引庫,每個(gè)索引庫都不大,后期的數(shù)據(jù)管理動(dòng)作,存取該索引庫的速度就快得多。

c381a374-5b12-11ed-a3b6-dac502259ad0.png

第二件事就是對單個(gè)節(jié)點(diǎn)索引庫進(jìn)行拆分,變成多節(jié)點(diǎn)索引庫的架構(gòu),實(shí)現(xiàn)索引性能按需線性增長。拆分的策略有很多,按照應(yīng)用數(shù)據(jù)源的不同,可以均衡負(fù)載,就近負(fù)載。

讀寫流程簡化,減少網(wǎng)絡(luò)傳輸

c39cdf22-5b12-11ed-a3b6-dac502259ad0.png

備份軟件+分布式存儲(chǔ)的松耦合設(shè)計(jì),由于備份軟件無法感知底層分布式存儲(chǔ)的存放位置,因此,數(shù)據(jù)需要先送到備份系統(tǒng),然后備份系統(tǒng)再送到底層分布式存儲(chǔ)系統(tǒng),分布式存儲(chǔ)再找具體節(jié)點(diǎn)落盤,中轉(zhuǎn)太多。

c3c4e058-5b12-11ed-a3b6-dac502259ad0.png

而AnyBackup Family 8則另辟蹊徑,把AnyBackup節(jié)點(diǎn)和存儲(chǔ)節(jié)點(diǎn)集成設(shè)計(jì),備份客戶端按照策略,直接把備份數(shù)據(jù)寫入指定節(jié)點(diǎn)(比如負(fù)載最輕的),該節(jié)點(diǎn)再復(fù)制到其他兩個(gè)節(jié)點(diǎn)。這樣做的好處就是減少了一次網(wǎng)絡(luò)轉(zhuǎn)發(fā),寫性能會(huì)大大提高。由于恢復(fù)客戶端也能感知到副本的位置,可以直接讀取負(fù)載最輕的某個(gè)副本,恢復(fù)性能也會(huì)大大提高。

由于備份系統(tǒng)可以控制數(shù)據(jù)具體的存儲(chǔ)位置,相關(guān)的數(shù)據(jù)可以盡量放在一起,減少跨節(jié)點(diǎn)的傳輸。不相關(guān)的數(shù)據(jù)則可以跨節(jié)點(diǎn)并發(fā)讀寫,整體的集群的性能要比備份軟件+分布式存儲(chǔ)的松耦合情況要高出很多。唯一的問題是集群的容量可能出現(xiàn)不均衡,可以通過自動(dòng)重平衡閑時(shí)進(jìn)行處理。

c2ab0b84-5b12-11ed-a3b6-dac502259ad0.gif

專用客戶端,實(shí)現(xiàn)直通掛載

c402c35a-5b12-11ed-a3b6-dac502259ad0.png

如果采用通用的存儲(chǔ)協(xié)議,掛載一般需要通過特定協(xié)議網(wǎng)關(guān),該網(wǎng)關(guān)再去其他節(jié)點(diǎn)取數(shù)據(jù),性能較差。

c41c158a-5b12-11ed-a3b6-dac502259ad0.png

由于AnyBackup Family 8采用專門的備份恢復(fù)客戶端,可以感知數(shù)據(jù)的存放位置,因此可以直接定位到數(shù)據(jù)所在節(jié)點(diǎn)的協(xié)議網(wǎng)關(guān),實(shí)現(xiàn)直通掛載,時(shí)延更低,IOPS更高。

這種高速掛載的能力,讓備份數(shù)據(jù)湖快速提供開發(fā)測試環(huán)境,快速提供分析應(yīng)用所需的數(shù)據(jù)成為功能。

c2ab0b84-5b12-11ed-a3b6-dac502259ad0.gif

無合成永久增量備份

c4428ae4-5b12-11ed-a3b6-dac502259ad0.png

傳統(tǒng)的增量備份,需要在后臺(tái)進(jìn)行數(shù)據(jù)的合成,對系統(tǒng)的性能影響很大。

c4649094-5b12-11ed-a3b6-dac502259ad0.png

愛數(shù)的上一代產(chǎn)品,采用索引合并的方式,性能有所提升,但當(dāng)索引的數(shù)據(jù)量上升,耗時(shí)還是很長的。

c47ebc76-5b12-11ed-a3b6-dac502259ad0.png

而在AnyBackup Family 8里,愛數(shù)取消了后臺(tái)合成的過程,在增量備份的時(shí)候,實(shí)時(shí)修改索引,然后利用全量快照就可以生成黃金副本,無需后臺(tái)合成過程,增量備份的性能得到巨大的提升。

c2ab0b84-5b12-11ed-a3b6-dac502259ad0.gif

無索引文件提高掛載速度

c4a5bd9e-5b12-11ed-a3b6-dac502259ad0.png

通用的文件系統(tǒng),需要訪問索引,然后才能訪問到數(shù)據(jù),因此其性能一般來說不如塊設(shè)備。AnyBackup Family 8引入一種新的文件類型FileDev,沒有索引,節(jié)省了查詢索引的過程,直接訪問數(shù)據(jù),性能更好。

c4ba600a-5b12-11ed-a3b6-dac502259ad0.png

這些無索引文件FileDev,其實(shí)就是一種VMDK文件,它可以通過iSCSI掛載,也可以通過NFS進(jìn)行聚合掛載,可以實(shí)現(xiàn)即時(shí)的數(shù)據(jù)服務(wù)。

c2ab0b84-5b12-11ed-a3b6-dac502259ad0.gif

性能爆表

正是上面的性能優(yōu)化技術(shù),將AnyBackup Family 8的3節(jié)點(diǎn)的備份恢復(fù)吞吐直接提升至5.1GB/s和9.21GB/s。

c4ebf9bc-5b12-11ed-a3b6-dac502259ad0.png

根據(jù)愛數(shù)發(fā)布的數(shù)據(jù),相比上一代產(chǎn)品,AnyBackup Family 8在各方面的性能提升基本都在50%以上。

神盾會(huì)上,愛數(shù)還展示了AnyBackup Family 8在百億級小文件保護(hù)、百TB級數(shù)據(jù)庫分鐘級掛載、海量虛擬機(jī)保護(hù)、PB級數(shù)據(jù)倉庫高效備份、大規(guī)模測試數(shù)據(jù)管理等數(shù)據(jù)管理場景下的性能數(shù)據(jù),顯示其備份數(shù)據(jù)湖的卓越性能。

小結(jié)

從上面的分析,我們看到,愛數(shù)并沒有把AnyBackup Family 8備份數(shù)據(jù)湖底層的分布式存儲(chǔ)做成通用的存儲(chǔ),來和其他廠商的軟件定義存儲(chǔ)產(chǎn)品競爭。而是采用集成系統(tǒng)的思路,把數(shù)據(jù)管理應(yīng)用和分布式存儲(chǔ)進(jìn)行緊耦合的設(shè)計(jì),讓整體數(shù)據(jù)管理平臺(tái)的性能不僅能夠進(jìn)行快速的備份和恢復(fù),也能進(jìn)行高速的掛載,提供接近生產(chǎn)系統(tǒng)的高性能的數(shù)據(jù)服務(wù),真正發(fā)揮備份數(shù)據(jù)湖的價(jià)值。

愛數(shù)的很多的性能優(yōu)化思路,在業(yè)界都是獨(dú)創(chuàng)的,如無合成的永久增量備份等,值得其他做第二存儲(chǔ)的公司借鑒。當(dāng)然,需要了解更多的細(xì)節(jié),還是建議大家回看愛數(shù)的神盾會(huì)(八)。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 存儲(chǔ)
    +關(guān)注

    關(guān)注

    13

    文章

    4123

    瀏覽量

    85276
  • 軟件
    +關(guān)注

    關(guān)注

    69

    文章

    4570

    瀏覽量

    86699
  • 數(shù)據(jù)管理
    +關(guān)注

    關(guān)注

    1

    文章

    277

    瀏覽量

    19556

原文標(biāo)題:不走尋常路,打造現(xiàn)代化數(shù)據(jù)管理平臺(tái)的性能爆表之路

文章出處:【微信號(hào):High-end_Storage,微信公眾號(hào):高端存儲(chǔ)知識(shí)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    可視數(shù)據(jù)管理平臺(tái)有哪些常見的功能模塊?#數(shù)據(jù)管理平臺(tái) #光點(diǎn)科技

    數(shù)據(jù)管理可視
    光點(diǎn)科技
    發(fā)布于 :2023年12月01日 09:42:31

    [原創(chuàng)]逐漸智能現(xiàn)代化公安裝備

    黨委就提出了“堅(jiān)持公安裝備現(xiàn)代化建設(shè)不動(dòng)搖并適當(dāng)超前”的理念,研究制定了公安裝備建設(shè)規(guī)劃,確定了公安裝備建設(shè)的指導(dǎo)思想、主要目標(biāo)和重點(diǎn)建設(shè)項(xiàng)目。在此基礎(chǔ)上,公安部對公安裝備管理體制和機(jī)制進(jìn)行了改革
    發(fā)表于 12-26 12:21

    基于RFID的現(xiàn)代化奶牛場管理應(yīng)用

    0 引言 信息與自動(dòng)現(xiàn)代管理技術(shù)在畜牧業(yè)發(fā)展中的地位越來越重要,基于無線射頻原理的奶牛自動(dòng)識(shí)別系統(tǒng),是現(xiàn)代化奶牛場管理 中不可或缺的一部分。無線射頻識(shí)別技術(shù)(RFID)是一種非接觸
    發(fā)表于 07-17 08:31

    數(shù)據(jù)管理功能詳解

    設(shè)計(jì)和數(shù)據(jù)標(biāo)準(zhǔn)的同時(shí),進(jìn)一步實(shí)現(xiàn)行業(yè)數(shù)字互通、產(chǎn)業(yè)智能互聯(lián)。浩辰3D軟件作為創(chuàng)新研發(fā)類工業(yè)軟件,不僅在智能設(shè)計(jì)和創(chuàng)新研發(fā)方面有著獨(dú)特的優(yōu)勢,在
    發(fā)表于 11-03 15:32

    SLM仿真過程與數(shù)據(jù)管理平臺(tái)介紹

    SLM仿真過程與數(shù)據(jù)管理平臺(tái)
    發(fā)表于 01-07 06:58

    怎么強(qiáng)化現(xiàn)代化IC的設(shè)計(jì)環(huán)境?

    數(shù)字設(shè)計(jì)及驗(yàn)證技術(shù)演進(jìn)的概觀現(xiàn)代化IC設(shè)計(jì)環(huán)境必須強(qiáng)化的方法
    發(fā)表于 04-09 06:17

    【學(xué)習(xí)打卡】OpenHarmony的分布式數(shù)據(jù)管理介紹

    中,精心設(shè)計(jì)的架構(gòu)為數(shù)據(jù)庫和其他數(shù)據(jù)平臺(tái)提供了一個(gè)模型,在該模型上將部署特定技術(shù)以適應(yīng)各個(gè)應(yīng)用程序。分布式數(shù)據(jù)管理作為OpenHarmony系統(tǒng)的模塊之一,它建立在分布式軟總線的基礎(chǔ)上
    發(fā)表于 07-15 15:49

    HarmonyOS數(shù)據(jù)管理與應(yīng)用數(shù)據(jù)持久(一)

    一. 數(shù)據(jù)管理概述 功能介紹 數(shù)據(jù)管理為開發(fā)者提供數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)管理能力,比如聯(lián)系人應(yīng)用數(shù)據(jù)可以保存到數(shù)
    發(fā)表于 11-01 16:27

    現(xiàn)代化電信網(wǎng)絡(luò)管理方式的研究

    本文從分析我國電信網(wǎng)網(wǎng)絡(luò)管理的現(xiàn)狀以及存在的問題入手,結(jié)合國際上通信發(fā)達(dá)國家電信網(wǎng)絡(luò)管理的理論和成功經(jīng)驗(yàn),歸納出了現(xiàn)代化電信網(wǎng)絡(luò)管理應(yīng)具有的一些基本特征,從而建立
    發(fā)表于 03-29 20:59 ?27次下載

    ONTAP_9_數(shù)據(jù)管理軟件_簡化向現(xiàn)代化數(shù)據(jù)中心的過渡

    ONTAP_9_數(shù)據(jù)管理軟件_簡化向現(xiàn)代化數(shù)據(jù)中心的過渡
    發(fā)表于 12-28 14:54 ?0次下載

    東軟正式發(fā)布主數(shù)據(jù)管理平臺(tái)產(chǎn)品SaCa MDM

    近日,東軟正式發(fā)布主數(shù)據(jù)管理平臺(tái)產(chǎn)品SaCa MDM (SaCa Master Data Management) ,旨在幫助企業(yè)實(shí)現(xiàn)一致、可信、準(zhǔn)確、及時(shí)的主數(shù)據(jù)管理,滿足企業(yè)的業(yè)務(wù)流程運(yùn)轉(zhuǎn)和事務(wù)處理,構(gòu)建數(shù)字
    的頭像 發(fā)表于 06-02 09:24 ?1481次閱讀

    Quest :數(shù)據(jù)倉庫現(xiàn)代化

    Quest數(shù)據(jù)倉庫現(xiàn)代化解決方案讓組織能夠?qū)ζ渌x云數(shù)據(jù)平臺(tái)中的戰(zhàn)略數(shù)據(jù)資產(chǎn)進(jìn)行建模、遷移和監(jiān)管。這些解決方案利用QuestData Emp
    的頭像 發(fā)表于 01-12 11:11 ?755次閱讀

    數(shù)據(jù)管理駕駛艙(工業(yè)數(shù)據(jù)可視平臺(tái))是什么?有什么功能?

    數(shù)據(jù)視圖,也無法對整個(gè)生產(chǎn)流程進(jìn)行合理的分析和決策。因此,數(shù)據(jù)管理駕駛艙成為企業(yè)管理數(shù)據(jù)的重要幫手之一。 一、什么是數(shù)據(jù)管理駕駛艙 數(shù)之能
    的頭像 發(fā)表于 07-20 14:28 ?1589次閱讀

    喜報(bào)丨軟通動(dòng)力應(yīng)用現(xiàn)代化平臺(tái)工程產(chǎn)品及服務(wù)解決方案榮獲“2023年應(yīng)用現(xiàn)代化典型案例”稱號(hào)

    在數(shù)字經(jīng)濟(jì)時(shí)代,應(yīng)用現(xiàn)代化正在成為一個(gè)共識(shí)。 近日,中國軟件行業(yè)協(xié)會(huì)首屆“應(yīng)用現(xiàn)代化產(chǎn)業(yè)實(shí)踐優(yōu)秀案例”評選結(jié)果揭曉, 軟通動(dòng)力應(yīng)用現(xiàn)代化研究中心打造的應(yīng)用現(xiàn)代化
    的頭像 發(fā)表于 11-13 19:30 ?589次閱讀
    喜報(bào)丨軟通動(dòng)力應(yīng)用<b class='flag-5'>現(xiàn)代化</b><b class='flag-5'>平臺(tái)</b>工程產(chǎn)品及服務(wù)解決方案榮獲“2023年應(yīng)用<b class='flag-5'>現(xiàn)代化</b>典型案例”稱號(hào)

    軟通動(dòng)力應(yīng)用現(xiàn)代化平臺(tái)工程產(chǎn)品及服務(wù)解決方案榮獲“2023年應(yīng)用現(xiàn)代化典型案例”稱號(hào)

    的應(yīng)用現(xiàn)代化平臺(tái)工程產(chǎn)品及服務(wù)解決方案榮獲“2023年應(yīng)用現(xiàn)代化典型案例”稱號(hào)。該評選旨在加快推動(dòng)應(yīng)用現(xiàn)代化發(fā)展與推廣應(yīng)用,形成行業(yè)應(yīng)用帶動(dòng)和示范作用,打造應(yīng)用
    的頭像 發(fā)表于 11-14 16:50 ?556次閱讀
    軟通動(dòng)力應(yīng)用<b class='flag-5'>現(xiàn)代化</b><b class='flag-5'>平臺(tái)</b>工程產(chǎn)品及服務(wù)解決方案榮獲“2023年應(yīng)用<b class='flag-5'>現(xiàn)代化</b>典型案例”稱號(hào)