在HPC計(jì)算和存儲(chǔ)業(yè)務(wù)中,針對(duì)文件系統(tǒng)的IO請(qǐng)求中,一半以上是元數(shù)據(jù)訪問。元數(shù)據(jù)訪問特點(diǎn):
I/O大小較?。ㄔ獢?shù)據(jù)大小通常只有幾百Byte),使得元數(shù)據(jù)服務(wù)器CPU的負(fù)載重
許多元數(shù)據(jù)操作包含多次子操作,例如打開文件需要進(jìn)行多次的路徑解析,使得元數(shù)據(jù)操作會(huì)觸發(fā)多次網(wǎng)絡(luò)I/O
當(dāng)前,主流并行文件系統(tǒng)大多采用分布式解決方案中,Lustre、CephFS采用子樹劃分+目錄條帶化;BeeGFS根據(jù)名稱的Hash值分布到多節(jié)點(diǎn);GlusterFS采用無中心架構(gòu);IndexFS的元數(shù)據(jù)以KV存儲(chǔ),通過GIGA+算法分布到多節(jié)點(diǎn)。
現(xiàn)有文件系統(tǒng)元數(shù)據(jù)管理的潛在缺陷:1)POSIX的語義限制了元數(shù)據(jù)性能提升,2)數(shù)據(jù)結(jié)構(gòu)不利于并發(fā)處理,3)元數(shù)據(jù)性能提升面臨的機(jī)遇,如IO設(shè)備跨越式發(fā)展(NVMe SSD充裕的IOPS和帶寬,多通道并發(fā)能力)。
針對(duì)文件系統(tǒng)元數(shù)據(jù)一直是文件系統(tǒng)的瓶頸問題,單點(diǎn)元數(shù)據(jù)性能仍然存在很大的提升空間,如沒有充分發(fā)揮IO效能,沒有充分發(fā)揮計(jì)算效能等,本文提出改進(jìn)數(shù)據(jù)結(jié)構(gòu),降低IO之間的依賴,發(fā)揮并行IO能力(降低目錄路徑解析延遲,降低大目錄訪問延遲,降低數(shù)據(jù)塊訪問延遲)改進(jìn)算法,發(fā)揮計(jì)算部件的并行計(jì)算能力等措施。
針對(duì)文件系統(tǒng)元數(shù)據(jù)一直是文件系統(tǒng)的瓶頸問題,單點(diǎn)元數(shù)據(jù)性能仍然存在很大的提升空間,如沒有充分發(fā)揮IO效能,沒有充分發(fā)揮計(jì)算效能等,本文提出改進(jìn)數(shù)據(jù)結(jié)構(gòu),降低IO之間的依賴,發(fā)揮并行IO能力(降低目錄路徑解析延遲,降低大目錄訪問延遲,降低數(shù)據(jù)塊訪問延遲)改進(jìn)算法,發(fā)揮計(jì)算部件的并行計(jì)算能力等措施。
-
存儲(chǔ)
+關(guān)注
關(guān)注
13文章
4123瀏覽量
85279 -
數(shù)據(jù)管理
+關(guān)注
關(guān)注
1文章
277瀏覽量
19556 -
文件系統(tǒng)
+關(guān)注
關(guān)注
0文章
280瀏覽量
19831
原文標(biāo)題:HPC并行文件:元數(shù)據(jù)如何縱向可擴(kuò)展?
文章出處:【微信號(hào):AI_Architect,微信公眾號(hào):智能計(jì)算芯世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論