0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

采用HDFS技術(shù)的云存儲的應(yīng)用解決方案

電子設(shè)計 ? 作者:電子設(shè)計 ? 2018-11-15 08:53 ? 次閱讀

海量的高校信息資源需要整合,這是當(dāng)前不爭的事實(shí),因?yàn)楦咝P畔①Y源存在著資源分布不均衡、更新維護(hù)成本高、共享程度低和安全性差等一系列問題。整合需要解決的首要問題就是信息的合理存儲,以便實(shí)現(xiàn)對其高效、安全的訪問。與傳統(tǒng)的存儲方式相比,云存儲很好地解決了這個問題。

云存儲(Cloud Storage)是在云計算(Cloud Computing)概念上延伸和發(fā)展出來的一個新的概念,它是指通過集群應(yīng)用、網(wǎng)格技術(shù)或分布式文件系統(tǒng)等功能,將網(wǎng)絡(luò)中大量各種不同類型的存儲設(shè)備通過應(yīng)用軟件集合起來協(xié)同工作,共同對外提供數(shù)據(jù)存儲和業(yè)務(wù)訪問功能的一個系統(tǒng)。

1 存儲方式的比較

高可靠性:云存儲實(shí)現(xiàn)對信息的分布式存儲,信息被切分為多個數(shù)據(jù)塊分散存儲在云中的節(jié)點(diǎn)中,實(shí)現(xiàn)了多副本備份機(jī)制,因此安全性要遠(yuǎn)高于傳統(tǒng)的單一甚至帶有鏡像服務(wù)器的信息存儲方式。

訪問的高效性:云中的控制節(jié)點(diǎn)通過"心跳檢測"不斷地監(jiān)視存儲節(jié)點(diǎn)的狀態(tài),當(dāng)發(fā)現(xiàn)存儲節(jié)點(diǎn)已經(jīng)失效時,控制節(jié)點(diǎn)能夠?qū)⒐ぷ髫?fù)載交給那些運(yùn)行正常的存儲節(jié)點(diǎn)來完成。同時,由于云中的數(shù)據(jù)是分布式的存儲,能夠很好地分擔(dān)存儲和訪問的壓力,這些都使得云存儲具有很高訪問的效率。

存儲成本低:原先的信息資源的存儲一般使用專業(yè)的存儲設(shè)備,價格不菲,使得資源存儲的成本也隨之提高。而云中的存儲設(shè)備都是廉價的商業(yè)機(jī),跟單一的大容量專業(yè)存儲設(shè)備相比較,存儲容量更大,存儲成本更低。

管理便捷:云存儲能夠在軟件層做到自動容錯而不依賴硬件本身的容錯,而且將信息資源存儲在云中,有利于對資源進(jìn)行統(tǒng)一的管理,提高資源的使用率。

另外,云存儲還具有超強(qiáng)的可擴(kuò)展性、不受具體地理位置所限、基于商業(yè)組件、按照使用收費(fèi)(如每G收15美分)、可跨不同應(yīng)用等。所有這些充分體現(xiàn)了云存儲這種方式的優(yōu)越性。

2 基于HDFS的云存儲

2.1 HDFS的引入

目前各大公司都有自己的云存儲產(chǎn)品,如微軟公司的"Windows Live Sky Drive"網(wǎng)絡(luò)移動硬盤服務(wù)、Google公司的"Google Stora ge"的云計算存儲服務(wù)、亞馬遜的Amazon webservices等。

在眾多的云存儲產(chǎn)品技術(shù)中,HDFS技術(shù)可以實(shí)施運(yùn)行在普通的PC集群上,有效降低存儲成本,該技術(shù)是Google文件系統(tǒng)(GFS)的開源實(shí)現(xiàn),是分布式計算開源框架Hadoop的底層實(shí)現(xiàn),Hadoop是Google集群系統(tǒng)的一個開源項(xiàng)目總稱,Google集群系統(tǒng)是使用低成本的成熟技術(shù)構(gòu)建的一個穩(wěn)定、高性能、高可用性、可擴(kuò)展的系統(tǒng)。Hadoop平臺雖然是一項(xiàng)新興的技術(shù),但它的發(fā)展非常迅速,已開始被應(yīng)用在企業(yè)、高校、科研機(jī)構(gòu)等各個行業(yè)。文中重點(diǎn)研究HDFS云存儲在高校信息整合中是如何應(yīng)用的。

2.2 HDFS的理論剖析

Hadoop文件系統(tǒng)(Hadoop Distributed File System,HDFS)雖然和現(xiàn)有的文件系統(tǒng)有相似之處,也是可以運(yùn)行在普通的硬件之上的分布式文件系統(tǒng),但是HDFS具有高容錯性,可以部署在低成本的硬件之上,可以以流的方式訪問文件數(shù)據(jù),從而高吞吐量地對應(yīng)用程序進(jìn)行訪問,這些還是和一般的文件系統(tǒng)有區(qū)別的。圖1是HDFS體系結(jié)構(gòu)圖。

采用HDFS技術(shù)的云存儲的應(yīng)用解決方案

圖1 HDFS體系結(jié)構(gòu)圖

研究HDFS的體系結(jié)構(gòu)圖可以得知,名稱節(jié)點(diǎn)上保存這控制數(shù)據(jù)節(jié)點(diǎn)信息的元數(shù)據(jù)。客戶端可以通過名稱節(jié)點(diǎn)對元數(shù)據(jù)進(jìn)行操作,也可以直接對數(shù)據(jù)節(jié)點(diǎn)進(jìn)行讀寫。HDFS體系結(jié)構(gòu)是個主從結(jié)構(gòu),這個主從結(jié)構(gòu)常由單個的名稱節(jié)點(diǎn)和多個數(shù)據(jù)節(jié)點(diǎn)組成,名稱節(jié)點(diǎn)負(fù)責(zé)管理文件命名空間和客戶端訪問的主服務(wù)器,而數(shù)據(jù)節(jié)點(diǎn)則負(fù)責(zé)對存儲進(jìn)行管理,下面來剖析一下體系結(jié)構(gòu)各部分的功能。

2.2.1 名稱節(jié)點(diǎn)和數(shù)據(jù)節(jié)點(diǎn)的功能

名稱節(jié)點(diǎn)的功能包括4個方面:一是管理元數(shù)據(jù)和文件塊:二是管理文件系統(tǒng)的命名空間,包括記錄文件系統(tǒng)元數(shù)據(jù)被修改的情況:三是監(jiān)聽客戶端和數(shù)據(jù)節(jié)點(diǎn)請求和處理這些請求??蛻舳耸录容^復(fù)雜,比如名字空間的創(chuàng)建與刪除,文件的創(chuàng)建、刪除和修改等,數(shù)據(jù)節(jié)點(diǎn)的事件包括文件塊信息變化、心跳響應(yīng)等:四是心跳檢測。所謂心跳檢測,就是數(shù)據(jù)節(jié)點(diǎn)會定期將自己的負(fù)載情況通過心跳信息向名稱節(jié)點(diǎn)匯報。

數(shù)據(jù)節(jié)點(diǎn)的功能包括3個方面:一是通過自身服務(wù)進(jìn)程與文件系統(tǒng)客戶端打交道,完成數(shù)據(jù)塊的讀寫;二是周期性的向名稱節(jié)點(diǎn)發(fā)送信號,報告本節(jié)點(diǎn)的狀態(tài);三是執(zhí)行數(shù)據(jù)的流水線復(fù)制。

2.2.2 元數(shù)據(jù)和數(shù)據(jù)交互

HDFS體系結(jié)構(gòu)中有三種類型的元數(shù)據(jù)保存在名稱節(jié)點(diǎn)的內(nèi)存中,分別是:文件(包含目錄)的名字空間、文件到文件塊的映射、文件塊的位置信息。這種數(shù)據(jù)結(jié)構(gòu)對于數(shù)據(jù)訪問的效率和安全性都有很大的幫助。

HDFS中數(shù)據(jù)的交互無外乎數(shù)據(jù)的讀和寫,重點(diǎn)設(shè)計的對象就是客戶端、名稱節(jié)點(diǎn)和數(shù)據(jù)節(jié)點(diǎn)??蛻舳耸紫葟拿Q節(jié)點(diǎn)中讀取對應(yīng)的文件塊信息,再和數(shù)據(jù)節(jié)點(diǎn)建立連接并獲取數(shù)據(jù),圖2具體描述了數(shù)據(jù)讀取過程。

采用HDFS技術(shù)的云存儲的應(yīng)用解決方案

圖2HDFS 數(shù)據(jù)讀取過程

HDFS的數(shù)據(jù)寫入過程比讀取過程細(xì)節(jié)上更為復(fù)雜一些,但是模型圖非常類似。除了數(shù)據(jù)的讀寫,維護(hù)數(shù)據(jù)的可用性和一致性也是系統(tǒng)最基本的要求和重要的功能。一般來說,系統(tǒng)通過數(shù)據(jù)復(fù)制、節(jié)點(diǎn)故障、數(shù)據(jù)校驗(yàn)、垃圾回收機(jī)制來維護(hù)數(shù)據(jù)的可用性和一致性。

3 HDFS的云存儲應(yīng)用于整合高校信息資源

3.1 系統(tǒng)分析與設(shè)計

目前高校信息資源面臨著空前的海量數(shù)據(jù)管理難題,存儲數(shù)據(jù)的成本在不斷增加,而且信息的安全性也亟待提高。因此要借用云存儲這種新的工作模式來解決這個問題。根據(jù)高校的特殊情況,結(jié)合云存儲的優(yōu)點(diǎn),要設(shè)計一個成功的云存儲案例,需要考慮這么幾個方面:

1)低成本海量存儲 將數(shù)據(jù)存儲在一般的個人電腦構(gòu)成的網(wǎng)絡(luò)中,并進(jìn)行合理調(diào)配,構(gòu)成一個有機(jī)海量存儲設(shè)備。

2)高效率的訪問 數(shù)據(jù)盡可能的存儲在不同的數(shù)據(jù)節(jié)點(diǎn)中,當(dāng)客戶端對信息進(jìn)行請求時,能高效的回復(fù),并做到并發(fā)。

3)安全性高 每個文件都會有多個副本分別存儲在多個數(shù)據(jù)節(jié)點(diǎn)上。如果某個數(shù)據(jù)節(jié)點(diǎn)出現(xiàn)問題,不會發(fā)生文件丟失的現(xiàn)象。

3.2 系統(tǒng)功能設(shè)計

高校相對于云存儲系統(tǒng)是一個用戶,而高校內(nèi)部有多個部門,相對于云存儲系統(tǒng)的用戶高校來說是一個子用戶。云存儲系統(tǒng)能夠創(chuàng)建、管理、維護(hù)高校云存儲用戶;高校云用戶能夠創(chuàng)建、管理、維護(hù)各部門子用戶。而子用戶才是真正的終端信息存儲用戶,他們上傳、下載、刪除數(shù)據(jù)信息。由于我們的這個系統(tǒng)是基于HDFS的,而一個基本的HDFS由一個NameNode和n個DataNode組成,云存儲系統(tǒng)是由多個地方的HDFS存儲設(shè)備通過應(yīng)用軟件集合起來協(xié)同工作,完成外部訪問請求??梢詫⒈疚拿枋龅姆植际轿募到y(tǒng)(DFS)抽象成一個三級模型,如圖3所示。

采用HDFS技術(shù)的云存儲的應(yīng)用解決方案

圖3 系統(tǒng)結(jié)構(gòu)圖

根據(jù)系統(tǒng)結(jié)構(gòu)圖可以清楚看到本文描述的分布式文件系統(tǒng)(DFS)的業(yè)務(wù)邏輯模型:終端網(wǎng)絡(luò)發(fā)出信息存取訪問請求,DFS通過封裝與HDFS通信協(xié)議的Client客戶端與基于HDFS的云存儲系統(tǒng)進(jìn)行通信,完成對信息的訪問。HDFS存儲業(yè)務(wù)以云狀分布在網(wǎng)絡(luò)的各個部分,它具有容量大、性能高、可靠性好、協(xié)同優(yōu)良的特點(diǎn),正是這些特點(diǎn),完成了高校信息資源高效訪問與存儲。

4 結(jié)論

基于HDFS的云存儲是一種動態(tài)可調(diào)整、基于互聯(lián)網(wǎng)的存儲解決方案,用戶可以通過通用和易用協(xié)議和應(yīng)用程序接口通過網(wǎng)絡(luò)訪問存儲目標(biāo),這種新技術(shù)對最終用戶來說很有好處。云存儲可以讓用戶很容易增加存儲容量,而且不需要購買、安裝和管理任何存儲基礎(chǔ)設(shè)施,卻提供了一個完善的備份、容災(zāi)數(shù)據(jù)中心。云存儲的成本和易用性優(yōu)勢對高校具有很強(qiáng)的吸引力,發(fā)展和應(yīng)用前景廣闊。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1748

    瀏覽量

    57207
  • 云計算
    +關(guān)注

    關(guān)注

    38

    文章

    7636

    瀏覽量

    136787
  • 云存儲
    +關(guān)注

    關(guān)注

    7

    文章

    720

    瀏覽量

    45920
收藏 人收藏

    評論

    相關(guān)推薦

    立體智慧倉儲解決方案.#計算

    解決方案智能設(shè)備
    學(xué)習(xí)電子知識
    發(fā)布于 :2022年10月06日 19:45:47

    采用Sun StorEdge技術(shù)創(chuàng)建存儲解決方案

    采用Sun StorEdge技術(shù)創(chuàng)建存儲解決方案用戶評價:Etagon公司開發(fā)經(jīng)理Ely Pinto說,“Sun StorEdge產(chǎn)品的高性能和低成本特性,使之成為我們幫助客戶實(shí)現(xiàn)快速
    發(fā)表于 11-13 21:21

    269私有服務(wù)器的完全解決方案

    越來越強(qiáng)烈,但出于成本、專業(yè)人員等方面的限制,他們做不到像大型企業(yè)那樣揮灑自如地投巨資建設(shè)。對于上述需求,目前已有相關(guān)的解決方案推出,上海源郵科技推出的269私有服務(wù)器(微信號:269微管家),采用
    發(fā)表于 04-13 18:11

    視頻監(jiān)控業(yè)務(wù)上方案解析

    摘要: 阿里針對安防監(jiān)控服務(wù)在傳統(tǒng)IT架構(gòu)下面臨的上述問題,基于阿里存儲服務(wù),提供視頻監(jiān)控解決方案。從2015年推出視頻監(jiān)控存儲與播放
    發(fā)表于 01-03 11:24

    hadoop hdfs 文件優(yōu)點(diǎn)

    應(yīng)用一般都是批量處理,而不是用戶交互式處理,應(yīng)用程序能以流的形式訪問數(shù)據(jù)集。Hadoop已經(jīng)迅速成長為首選的、適用于非結(jié)構(gòu)化數(shù)據(jù)的大數(shù)據(jù)分析解決方案,HDFS分布式文件系統(tǒng)是Hadoop的核心組件之一
    發(fā)表于 03-23 14:22

    阿里應(yīng)用上邊緣解決方案助力互聯(lián)網(wǎng)All in Cloud

    解決方案。其中,阿里應(yīng)用上邊緣解決方案作為互聯(lián)網(wǎng)企業(yè)上的助推器,在現(xiàn)場展示。應(yīng)用上邊緣
    發(fā)表于 10-11 09:58

    如何用MRAM和NVMe SSD構(gòu)建未來的存儲解決方案

    在2019全球閃存峰會上,Everspin作為全球MRAM存儲芯片龍頭分享如何用MRAM這類非易失性存儲和NVMe SSD構(gòu)建未來的存儲解決方案
    發(fā)表于 01-11 06:44

    備份解決方案的考慮要素

    從許多方面來看,解決了異地存儲數(shù)據(jù)備份這個問題。不過,盡管服務(wù)最近一直不乏營銷炒作,說到備份網(wǎng)絡(luò)上的數(shù)據(jù),它未必就是理想的解決方案。下面是你在
    發(fā)表于 03-14 10:41 ?802次閱讀

    計算是什么?存儲技術(shù)與應(yīng)用解決方案

    本專題為你講解計算與存儲技術(shù)資訊與應(yīng)用解決方案。具體包括解釋計算、
    發(fā)表于 03-29 18:23
    <b class='flag-5'>云</b>計算是什么?<b class='flag-5'>云</b><b class='flag-5'>存儲</b><b class='flag-5'>技術(shù)</b>與應(yīng)用<b class='flag-5'>解決方案</b>

    基于_NetApp_存儲的_Microsoft_私有解決方案

    基于_NetApp_存儲的_Microsoft_私有解決方案
    發(fā)表于 12-28 11:17 ?0次下載

    基于HDFS校園存儲平臺

    改進(jìn),并且DAO層實(shí)現(xiàn)校園云端網(wǎng)絡(luò)的可變動態(tài)操作。實(shí)踐應(yīng)用結(jié)果表明:優(yōu)化后的HDFS方案能夠有效地減少名稱節(jié)點(diǎn)內(nèi)存的損耗,擴(kuò)展了HDFS集群的命名空間,并且能夠有效地提升讀取文件元數(shù)據(jù)信息的速度。有效地提升了校園
    發(fā)表于 11-06 17:52 ?7次下載
    基于<b class='flag-5'>HDFS</b>校園<b class='flag-5'>云</b><b class='flag-5'>存儲</b>平臺

    應(yīng)對海量圖片存儲的分布式存儲解決方案

    隨著互聯(lián)網(wǎng)、計算及大數(shù)據(jù)等信息技術(shù)的發(fā)展,越來越多的應(yīng)用依賴于對海量數(shù)據(jù)的存儲和處理,如智能監(jiān)控、電子商務(wù)、地理信息等,這些應(yīng)用都需要對海量圖片的存儲和檢索。由于圖片大多是小文件(8
    發(fā)表于 01-09 15:41 ?3685次閱讀
    應(yīng)對海量圖片<b class='flag-5'>存儲</b>的分布式<b class='flag-5'>存儲</b><b class='flag-5'>解決方案</b>

    華為OBS對象存儲服務(wù)完成開源社區(qū)同行評審 正式合入Apache Hadoop社區(qū)

    近日,華為OBS對象存儲服務(wù)OBSA-HDFS組件代碼完成了開源社區(qū)同行評審,已經(jīng)正式合入Apache Hadoop社區(qū),標(biāo)志華為存算分離大數(shù)據(jù)
    的頭像 發(fā)表于 01-22 16:52 ?2258次閱讀

    企業(yè)級存儲解決方案的原理和分類

    許多企業(yè)已經(jīng)遷移到平臺中并發(fā)現(xiàn)了它的好處,為此也需要了解一些頂級存儲解決方案。
    發(fā)表于 04-05 14:07 ?1081次閱讀

    存儲監(jiān)控解決方案的8大優(yōu)勢

    存儲監(jiān)控工具正在成為電子監(jiān)控生態(tài)系統(tǒng)的支柱。存儲監(jiān)控解決方案提供完全私有的數(shù)據(jù)
    的頭像 發(fā)表于 03-29 16:37 ?2191次閱讀