此次TigerGraph在 36TB 規(guī)模的 LDBC SNB(社交網(wǎng)絡(luò)基準(zhǔn)) 基準(zhǔn)測(cè)試,為全新的測(cè)試,完全遵循了LDBC規(guī)范,所有BI query都通過(guò)測(cè)試(該報(bào)告中包含了所有結(jié)果),包含5396億條邊和726億個(gè)頂點(diǎn)。到目前為止,TigerGraph依然是唯一可以完成36TB LDBC BI workload的圖數(shù)據(jù)庫(kù)供應(yīng)商,并且完全可以通過(guò)第三方審計(jì)。
新的基準(zhǔn)測(cè)試使用了新版本的TigerGraph,在加載和查詢方 面都有改進(jìn)(例如,加載時(shí)間從 35.5 小時(shí)縮短到6.5 小時(shí),提升了將近5倍。power batch 的平均查詢時(shí)間從236.06秒縮短到99.90秒),提升了1.4倍。并且結(jié)果得到了SF-10上的另一個(gè)圖數(shù)據(jù)庫(kù)的交叉驗(yàn)證。
該報(bào)告記錄了TigerGraph在SF-30k上的LDBC SNB BI工作負(fù)載的完整執(zhí)行。這個(gè)基準(zhǔn)測(cè)試正在等待LDBC的審計(jì),它使用的官方基準(zhǔn)驅(qū)動(dòng)程序、查詢實(shí)現(xiàn)、數(shù)據(jù)和替 換參數(shù)生成器,都與TigerGraph在LDBC SNB SF-1000的審計(jì)報(bào)告中使用的相同。不同的是,這次的規(guī)模因子為SF-30k(即30TB級(jí)別)。在每批的查詢中使用5個(gè)替換參數(shù)執(zhí)行,而官方基準(zhǔn)測(cè)試使用30個(gè)不同的參數(shù)。power 和throughput 基準(zhǔn)指標(biāo)都是按照LDBC SNB規(guī)范的指南報(bào)告。
TigerGraph 是一個(gè)大規(guī)模并行處理 (MPP) 圖數(shù)據(jù)庫(kù)管理系統(tǒng),旨在處理混合事務(wù)/分析處理 (HTAP) 查詢工作負(fù)載。它是一個(gè)分布式平臺(tái),使用原生圖存儲(chǔ)格式和領(lǐng)先的分區(qū)策略。其中,每個(gè)圖分區(qū)都包含相似數(shù)量的頂點(diǎn)和邊,支持并行處理請(qǐng)求。TigerGraph提供 GSQL,這是一種圖靈完備的查詢語(yǔ)言,它具有聲明式特性(例如,圖模式匹配)和命令式特性(例如用于表達(dá)帶有循環(huán)和累加器原語(yǔ)的迭代圖算法)。
該基準(zhǔn)測(cè)試的重點(diǎn)是 TigerGraph 在一系列批量刷新的大圖上的商業(yè)智能 (BI) 工作負(fù)載性能。BI 工作負(fù)載包括:
20 個(gè)只讀查詢——大多數(shù) OLAP 式的迭代和深度鏈接圖查詢?cè)诓坏揭环昼姷綆追昼妰?nèi)就可以得到回答。查詢包括加權(quán)圖上的爆炸性和冗余多連接以及多源最 短路徑問(wèn)題。
增量批量更新——圖通過(guò)一組插入和刪除操作而發(fā)生變化。插入或刪除數(shù)據(jù)的批量處理周期為1天。
TigerGraph 服務(wù)器被部署在 36 個(gè)具有144TB 磁盤(pán)容量的Amazon Web Service (AWS) r6a.32xlarge 實(shí)例上。這些實(shí)例由第三代 AMD EPYC 處理器提供支持。以下摘要突出了一些關(guān)鍵數(shù)字:
總體而言,完整的源數(shù)據(jù)集約為36TB,包含5396億條邊和726億個(gè)頂點(diǎn)。
基準(zhǔn)測(cè)試總時(shí)間為19.3 小時(shí),包括初始數(shù)據(jù)加載、1 次 power batch運(yùn)行和 1 次throughput batch運(yùn)行。
硬件成本為281.27 美元/小時(shí),包括 36 臺(tái) A WS 機(jī)器和144T GP2 SSD 卷
該基準(zhǔn)測(cè)試清楚地證明了:
TigerGraph在執(zhí)行復(fù)雜查詢時(shí)能夠擴(kuò)展到更大的數(shù)據(jù)集的空前能力,這被認(rèn)為比關(guān)系聯(lián)接更具挑戰(zhàn)性;
TigerGraph適用于各種關(guān)系數(shù)據(jù)處理場(chǎng)景,尤其在數(shù)據(jù)量大、經(jīng)常有數(shù)據(jù)更新、需要快速實(shí)現(xiàn)復(fù)雜大數(shù)據(jù)量全圖計(jì)算(OLAP)的場(chǎng)景表現(xiàn)格外優(yōu)異;
TigerGraph在實(shí)際生產(chǎn)環(huán)境中處理大圖工作負(fù)載的能力,在這種環(huán)境中,數(shù)十TB的關(guān)聯(lián)數(shù)據(jù)每小時(shí)或每天增量更新是一種常態(tài)。據(jù)我們所知,其它圖數(shù)據(jù)庫(kù)或關(guān)系數(shù)據(jù)庫(kù)供應(yīng)商,沒(méi)有一家可以在這種大規(guī)??筛碌膱D上展示出同等的分析和操作能力。
審核編輯 :李倩
-
數(shù)據(jù)庫(kù)
+關(guān)注
關(guān)注
7文章
3752瀏覽量
64233 -
生成器
+關(guān)注
關(guān)注
7文章
313瀏覽量
20951
原文標(biāo)題:LDBC SNB SF30000 基準(zhǔn)測(cè)試報(bào)告全面披露
文章出處:【微信號(hào):TigerGraph,微信公眾號(hào):TigerGraph】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論