去年,NASA 選擇了亞馬遜云服務(wù)(AWS)來托管地球科學(xué)和 ESDIS 信息系統(tǒng)的數(shù)據(jù)。新數(shù)據(jù)庫可方便地整理相關(guān)任務(wù)信息,預(yù)計存儲需求會從當(dāng)前的 32PB 增長到近 250PB 。然而除了額外的容量需求,該機(jī)構(gòu)似乎忘記了 AWS 的數(shù)據(jù)訪問和檢索成本,即所謂的“出口費(fèi)用”。
資料圖(來自:NASA)
當(dāng)將數(shù)據(jù)從云端移動到另一個區(qū)域(比如供科學(xué)家進(jìn)行分析的本地工作站)時,NASA 將不得不在按月收取的服務(wù)費(fèi)的基礎(chǔ)上,再支付一筆額外的費(fèi)用。
換言之,檢索的數(shù)據(jù)越多,相關(guān)的開銷舊越大。目前該機(jī)構(gòu)將數(shù)據(jù)本地存儲在 12 個分布式的活動檔案中心(DAAC)中,但希望在未來幾年完成全面的云端遷移。
初次轉(zhuǎn)移計劃已在今年一季度開展,但相關(guān)數(shù)據(jù)都來自何處、NASA 又是如何精確到 215PB 的呢?
據(jù)悉,NASA 是根據(jù)該機(jī)構(gòu)即將開展的 15 次訪問來估算的,預(yù)計每日將產(chǎn)生 100TB 以上的信息。
其中包括 NASA-ISRO 合成孔徑雷達(dá)(NISAR)和地表水與海洋地形(SWOT)衛(wèi)星的數(shù)據(jù),這部分將率先上傳到 Earthdata Cloud 。
若該機(jī)構(gòu)可以負(fù)擔(dān)得起這部分?jǐn)?shù)據(jù)出口費(fèi)用,那將所有這些數(shù)據(jù)存儲在云端(而不是像現(xiàn)在這樣分散),將對 NASA 研究人員大有裨益。
2017 ~ 2025 數(shù)據(jù)增長量(藍(lán)色)/ 提取速度(橙色)
遺憾的是,根據(jù) NASA 監(jiān)察長辦公室在今年 3 月份發(fā)布的一份審計報告,相關(guān)模擬并不能準(zhǔn)確地得出 ESDIS 和 EOSDIS 的出口費(fèi)用將有多高。
若 NASA 出于成本控制的原因而限制數(shù)據(jù)的輸出量,此舉也將帶來一些潛在的風(fēng)險,即科學(xué)數(shù)據(jù)對最終用戶的可訪問性將大大地降低。
基于此,該報告提出了三點(diǎn)建議:
首先,一旦 NISAR 和 SWOT 投入運(yùn)營并提供了足夠的數(shù)據(jù),NASA 必須完成獨(dú)立的分析,以確定云遷移和保障當(dāng)前 DAAC 運(yùn)營的長期財務(wù)可持續(xù)性。
其次,適當(dāng)納入機(jī)構(gòu)指導(dǎo),以在制定數(shù)據(jù)管理計劃的早期階段,做好 ESDIS 和 OCIO 的協(xié)調(diào)工作。
第三,確保在 DAAC 分類過程中考慮所有適用的信息類型,在確定影響級別時考慮適當(dāng)?shù)那疤幔ο嚓P(guān)流程做到標(biāo)準(zhǔn)化。
-
NASA
+關(guān)注
關(guān)注
0文章
427瀏覽量
30878 -
AWS
+關(guān)注
關(guān)注
0文章
427瀏覽量
24294
發(fā)布評論請先 登錄
相關(guān)推薦
評論