0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

固態(tài)硬盤內(nèi)RAID5技術

VIBT_dputech ? 來源:大普微 ? 作者:大普微 ? 2020-09-25 17:24 ? 次閱讀

提到冗余保護,最容易想到的就是RAID(Redundant Arrays of Independent Disks)。它是一種把多塊獨立的物理硬盤按不同方式組合形成一個硬盤組,以此提供比單個硬盤更高的存儲性能和數(shù)據(jù)冗余的技術。該技術在服務器和存儲陣列產(chǎn)品中廣泛應用。

近年來,隨著固態(tài)硬盤的使用率上升,提升固態(tài)硬盤的性能和可靠性(包括壽命)一直是行業(yè)攻關的重點。RAID技術在固態(tài)硬盤內(nèi)已經(jīng)得到了廣泛應用。關鍵數(shù)據(jù)多副本,可以看作是RAID1保護,用戶數(shù)據(jù)更常見的則是使用性價比較高的RAID5。具體使用什么RAID級別,一般是根據(jù)實際情況進行選擇。DapuStor的HaiShen系列產(chǎn)品就使用RAID5技術為用戶數(shù)據(jù)提供冗余保護,提升可靠性。這里,我們就將盤內(nèi)RAID5技術做一個簡單介紹。

RAID5原理

數(shù)據(jù)按條帶分布在不同位置,比如圖中A1~Ap是一個條帶,B1~Bp是另一個條帶,每個條帶中的一份數(shù)據(jù)(比如A1)叫做條帶單元。每個條帶有一份校驗數(shù)據(jù)(比如Ap),所以我們一般也稱它為N+1的RAID組。RAID5校驗計算通常采用異或(XOR)算法。現(xiàn)在很多主控也提供RAID5計算的硬件加速功能。

盤內(nèi)RAID5條帶布局

為了保證任意時候,一個Block或者DIE損壞,不會導致數(shù)據(jù)丟失。一個RAID5條帶中的每個條帶單元最好是來自不同的Block和不同的DIE。這種我們一般稱為DIE級別的RAID冗余。跟上圖對應,比如A1數(shù)據(jù)在DIE 1的某個Block,A2數(shù)據(jù)在DIE2的某個Block。最直觀的組條帶方式就是每個DIE各選一個Block,然后每個Block的相同Page組成一個條帶。各個Block的Page組成RAID5條帶有下面幾種常見布局:

1)固定DIE的布局

在組成一個RAID組的Block中,使用一個固定DIE的Block存儲校驗(類似傳統(tǒng)的RAID3),但是組成不同RAID組的Block可以不同。

2)旋轉(zhuǎn)布局

組成一個RAID組的Block中,校驗不固定在某個Block上,而是有規(guī)律的旋轉(zhuǎn)變化(RAID5的旋轉(zhuǎn)布局有多種方式,此處只列舉了一種)。

不同的數(shù)據(jù)布局,會產(chǎn)生不同的盤內(nèi)數(shù)據(jù)布局。最直觀的,順序?qū)懞螅樞蜃x,各個DIE或者Block上的壓力模型,在前面提到兩種布局下是不同的。

RAID5數(shù)據(jù)恢復

如果Host 讀某個Nand Page發(fā)生UNC(UNCorrectable)錯誤,這時RAID5恢復的原理是讀這個條帶內(nèi)其他數(shù)據(jù)和校驗數(shù)據(jù),進行計算,得到期望的數(shù)據(jù)。

盤內(nèi)RAID的異常處理

RAID5的數(shù)據(jù)恢復依賴分條的完整性,因為故障可能發(fā)生在任何階段,所以數(shù)據(jù)恢復前必須判斷出校驗的有效性,避免恢復出錯誤數(shù)據(jù)。

典型場景1:某個Nand Block故障時,這個Block已經(jīng)在一個寫完成的條帶上,此時RAID其實處于降級狀態(tài),較優(yōu)的想法是把相關條帶的數(shù)據(jù)重新放到一個健康的條帶或者重建出故障Block的數(shù)據(jù)來替換它。

典型場景2:某個Nand Block 故障時,此時還沒有數(shù)據(jù)寫入,盡量把它從RAID組的Block中剔除,選一個健康的Block替換或者讓當前RAID組從N+1保護轉(zhuǎn)換成(N-1)+1。

典型場景3:一個條帶單元的數(shù)據(jù)寫入Nand 過程中發(fā)生了Program fail,同時另一個位置的讀又遇到UNC,這些場景在DapuStor的HaiShen系列產(chǎn)品中都有專門處理,保障可以恢復出正確數(shù)據(jù)。

因為錯誤可能發(fā)生在任何時刻,所以其他場景這里就不一一列舉。

RAID帶來的影響

1.OP(Over Provisioning)空間降低

引入RAID后,有的Nand空間用于存儲校驗數(shù)據(jù),間接導致用戶數(shù)據(jù)的可用OP空間降低,

2.WA(Write Amplification)變大

因為每個條帶額外寫入了一份校驗數(shù)據(jù),所以整個生命周期的WA會增大。

3.性能影響

前面兩點提到的OP變小,寫放大變大,其實最終也都會表現(xiàn)成對性能的影響。另外,一個直觀感受是順序?qū)懞妥x的過程,因為每個條帶都有一個DIE沒有提供給Host IO服務,所以性能也必定會有影響。

盤內(nèi)冗余技術發(fā)展

RAID5為用戶數(shù)據(jù)提供了N+1級別的冗余保護。隨著盤內(nèi)功能增強,業(yè)務對盤內(nèi)可靠性要求的提高,不同成本和可靠性定位的用戶可能會需要不同冗余保護的級別。技術上還有一些更高級別的冗余保護:

1.RAID6

相比RAID5的N+1,它提供了N+2的保護。對應在SSD產(chǎn)品中,它當然也會帶來更大的OP損耗。

2.EC(Erasure Coding)

現(xiàn)在分布式存儲時代,多備份和EC相比傳統(tǒng)RAID是更廣泛的應用。EC算法提供了N+M的保護級別,可以有更廣闊的選擇空間。

原文標題:盤內(nèi)數(shù)據(jù)冗余保護

文章出處:【微信公眾號:大普微】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

責任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:盤內(nèi)數(shù)據(jù)冗余保護

文章出處:【微信號:dputech,微信公眾號:DapuStor】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    服務器數(shù)據(jù)恢復—用5RAID5陣列中的4塊盤重建RAID5陣列后如何恢復原始數(shù)據(jù)?

    服務器數(shù)據(jù)恢復環(huán)境: 一臺服務器掛接一臺存儲,該存儲中有一組由5硬盤組建的RAID5陣列。 服務器故障: 存儲raid5陣列中有一塊硬盤
    的頭像 發(fā)表于 10-30 15:07 ?115次閱讀

    RAID5數(shù)據(jù)恢復—如何重組RAID5陣列?

    RAID5數(shù)據(jù)恢復環(huán)境: 一臺存儲上有一組由12塊SCSI硬盤(11塊數(shù)據(jù)盤+1塊熱備盤)組建的RAID5磁盤陣列,F(xiàn)reeBSD操作系統(tǒng)+zfs文件系統(tǒng)。 RAID5故障: 其
    的頭像 發(fā)表于 10-22 15:48 ?136次閱讀
    <b class='flag-5'>RAID5</b>數(shù)據(jù)恢復—如何重組<b class='flag-5'>RAID5</b>陣列?

    服務器數(shù)據(jù)恢復—Raid5陣列兩塊硬盤指示燈亮黃色的數(shù)據(jù)恢復案例

    服務器數(shù)據(jù)恢復環(huán)境: 一臺某品牌存儲設備上有一組由10塊硬盤(9塊數(shù)據(jù)盤+1塊熱備盤)組建的raid5陣列,上層部署vmware exsi虛擬化平臺。 服務器故障: raid5陣列中兩塊
    的頭像 發(fā)表于 10-10 13:48 ?116次閱讀
    服務器數(shù)據(jù)恢復—<b class='flag-5'>Raid5</b>陣列兩塊<b class='flag-5'>硬盤</b>指示燈亮黃色的數(shù)據(jù)恢復案例

    服務器數(shù)據(jù)恢復—5RAID5陣列重建4盤raid5陣列如何恢復原raid5數(shù)據(jù)?

    一臺服務器,有一組由5硬盤組建的raid5磁盤陣列。 服務器在運行過程中一塊有磁盤掉線,由于raid5陣列支持一塊磁盤掉線的特性,服務器還在正常工作。不久之后服務器出現(xiàn)故障,管理員
    的頭像 發(fā)表于 07-16 13:49 ?313次閱讀
    服務器數(shù)據(jù)恢復—<b class='flag-5'>5</b>盤<b class='flag-5'>RAID5</b>陣列重建4盤<b class='flag-5'>raid5</b>陣列如何恢復原<b class='flag-5'>raid5</b>數(shù)據(jù)?

    服務器數(shù)據(jù)恢復—EMC存儲中raid5陣列多塊硬盤離線的數(shù)據(jù)恢復案例

    突然崩潰。管理員檢查發(fā)現(xiàn)存儲中的raid5陣列有兩塊硬盤離線,該陣列中的兩塊熱備盤只有一塊熱備盤激活成功,raid5陣列癱瘓,存儲不可用。
    的頭像 發(fā)表于 07-09 11:58 ?191次閱讀

    服務器數(shù)據(jù)恢復—raid5陣列硬盤壞道導致raid崩潰的數(shù)據(jù)恢復案例

    服務器存儲數(shù)據(jù)恢復環(huán)境: 某單位一臺某品牌DS5300存儲,1個機頭+4個擴展柜,50塊硬盤組建2組RAID5磁盤陣列(一組raid5陣列有27塊成員盤,存放Oracle數(shù)據(jù)庫文件;另外一組
    的頭像 發(fā)表于 07-05 12:00 ?455次閱讀

    服務器數(shù)據(jù)恢復—raid5熱備盤同步過程中硬盤離線的數(shù)據(jù)恢復案例

    某品牌DS5300存儲,包含一個存儲機頭和多個磁盤柜,組建了多組RAID5磁盤陣列。 某個磁盤柜中的一組RAID5陣列由15塊數(shù)據(jù)盤和1塊熱備硬盤組建。該磁盤柜中的某塊硬盤離線,熱備
    的頭像 發(fā)表于 06-20 11:13 ?222次閱讀

    服務器數(shù)據(jù)恢復—X3650服務器raid5磁盤陣列數(shù)據(jù)恢復案例

    內(nèi)的數(shù)據(jù)丟失。 數(shù)據(jù)恢復工程師在現(xiàn)場對故障服務器raid5陣列中的磁盤進行硬件故障檢測,經(jīng)過檢測發(fā)現(xiàn)該raid5陣列中離線的兩塊硬盤均無硬件問題。
    的頭像 發(fā)表于 06-04 11:08 ?467次閱讀

    服務器數(shù)據(jù)恢復—RAID5陣列硬盤報警亮黃燈的數(shù)據(jù)恢復案例

    服務器數(shù)據(jù)恢復環(huán)境: 某品牌P2000服務器,有一組由數(shù)塊硬盤組建的raid5磁盤陣列(有熱備盤),部署了VMWARE ESX虛擬化平臺,VMFS文件系統(tǒng)。 服務器故障: 服務器在正常運行
    的頭像 發(fā)表于 05-30 11:43 ?989次閱讀
    服務器數(shù)據(jù)恢復—<b class='flag-5'>RAID5</b>陣列<b class='flag-5'>硬盤</b>報警亮黃燈的數(shù)據(jù)恢復案例

    服務器數(shù)據(jù)恢復—不同型號服務器的RAID5數(shù)據(jù)恢復策略

    RAID5作為應用最廣泛的raid陣列級別之一,在不同型號服務器中的RAID5出現(xiàn)故障后,處理方法也不同。 RAID5陣列級別是無獨立校驗磁盤的奇偶校驗磁盤陣列,采用數(shù)據(jù)分塊和獨立存
    的頭像 發(fā)表于 04-12 14:51 ?321次閱讀

    raid5熱備盤同步過程中磁盤離線導致同步失敗的數(shù)據(jù)恢復案例

    一臺存儲上有一組由多塊硬盤組建的raid5陣列,該raid5陣列中的一塊硬盤掉線,熱備盤自動上線同步數(shù)據(jù)的過程中,raid陣列中又有一塊
    的頭像 發(fā)表于 03-14 15:47 ?330次閱讀

    服務器數(shù)據(jù)恢復—華為OceanStor存儲raid5數(shù)據(jù)恢復案例

    服務器數(shù)據(jù)恢復環(huán)境: 華為OceanStor某型號存儲,存儲內(nèi)有一組由24塊硬盤組建的raid5陣列,配置1塊熱備盤。 服務器故障: 該存儲raid5陣列中有一塊硬盤離線,熱
    的頭像 發(fā)表于 01-18 11:58 ?422次閱讀
    服務器數(shù)據(jù)恢復—華為OceanStor存儲<b class='flag-5'>raid5</b>數(shù)據(jù)恢復案例

    【服務器數(shù)據(jù)恢復】Raid5硬盤離線導致熱備盤上線同步失敗的數(shù)據(jù)恢復案例

    服務器數(shù)據(jù)恢復環(huán)境: 兩組由4塊磁盤組建的raid5磁盤陣列,兩組raid5陣列劃分為lun并組成了lvm結(jié)構(gòu),ext3文件系統(tǒng)。 服務器故障: 一組raid5陣列中的一塊硬盤
    的頭像 發(fā)表于 01-08 13:38 ?285次閱讀

    服務器數(shù)據(jù)恢復—Raid5部分磁盤重建新raid5如何恢復原raid數(shù)據(jù)?

    一臺服務器上搭建了一組由5硬盤組建的raid5陣列,服務器上層存放單位重要數(shù)據(jù),無備份文件。
    的頭像 發(fā)表于 12-11 13:20 ?814次閱讀

    服務器數(shù)據(jù)恢復—EMC存儲raid5故障的數(shù)據(jù)恢復案例

    服務器存儲數(shù)據(jù)恢復環(huán)境: EMC某型號存儲,8塊組建一組raid5磁盤陣列。上層操作系統(tǒng)采用zfs文件系統(tǒng)。 服務器存儲故障&分析: raid5陣列中有2塊硬盤未知原因離線,raid
    的頭像 發(fā)表于 11-30 11:59 ?531次閱讀