我們?nèi)绾卧诨贜AND閃存的系統(tǒng)中實現(xiàn)最低的故障率?您可能已在工程團(tuán)隊或存儲系統(tǒng)供應(yīng)商之間進(jìn)行過此次討論。正在采取哪些措施來確保您獲得的質(zhì)量解決方案不僅可以有效地糾正將發(fā)生的不可避免的錯誤,而且建立一個如此強大的系統(tǒng)結(jié)構(gòu),可以防止一開始錯誤發(fā)生?
隨著NAND閃存的工藝幾何尺寸縮小,誤碼率不斷增加,從而導(dǎo)致系統(tǒng)故障率降低。任何了解SD卡,USB閃存驅(qū)動器和其他基于NAND閃存的解決方案基礎(chǔ)知識的人都知道,控制這些最小化故障率的關(guān)鍵組件是NAND閃存控制器。您可能熟悉此組件并討論過糾錯碼(ECC)強度。是否想過在這個小包裝里面究竟出現(xiàn)什么?閃存控制器為防止故障發(fā)生做了什么?ECC是一組不同構(gòu)建塊當(dāng)中的一個單元。系統(tǒng)設(shè)計相當(dāng)良好,其可靠性和防錯功能在整個進(jìn)程陣列中交錯,包括用于不可避免的位錯誤的ECC。若想要老板留下深刻印象并且為工作項目提供更多有價值的事物,建議您應(yīng)該繼續(xù)閱讀,因為我們會解釋極為強大的閃存控制器功能。
甚至在系統(tǒng)組裝之前,無論是在內(nèi)部還是通過系統(tǒng)集成商,都有一個重要的規(guī)劃標(biāo)準(zhǔn)進(jìn)入閃存認(rèn)證。換句話說,閃存控制器應(yīng)該與正確的閃存策略配對。那么資格認(rèn)定究竟是什么意思呢?資格認(rèn)證不僅意味著控制器將使用選定的閃存。最重要的是,它意味著測試,而且不僅僅是少數(shù)。在海派世通,我們確保組合已經(jīng)徹底測試過。首先是表征閃存本身。通過不同使用情況在所有生命周期階段中廣泛測試NAND閃存來完成表征。該知識有助于正確設(shè)計糾錯單元,提取用于糾錯的軟解碼的對數(shù)似然比(LLR)表,并實現(xiàn)最有效的整體錯誤恢復(fù)流程。
在規(guī)劃設(shè)計時,大多數(shù)公司會討論與總體成本相關(guān)的閃存,但許多人忘記考慮閃存的行為,因為它們的體系結(jié)構(gòu),環(huán)境和它們所暴露的用例。每種方案都需要獨特的處理,校正和恢復(fù)選項,以實現(xiàn)最佳結(jié)果。這種表征活動非常重要,因為所有收集的數(shù)據(jù)都能夠以最準(zhǔn)確和最有效的方式驗證工具。復(fù)雜且經(jīng)過深思熟慮的資格認(rèn)證是穩(wěn)健和穩(wěn)定系統(tǒng)的基礎(chǔ)工作。對于要求苛刻的系統(tǒng),與系統(tǒng)集成商一起質(zhì)疑和討論資格認(rèn)證過程是值得的。或者,如果內(nèi)部設(shè)計解決方案以獲得更大的靈活性,請直接向控制器公司咨詢。雖然可靠的認(rèn)證設(shè)置了成功的系統(tǒng),但校準(zhǔn)和控制器功能(如讀取干擾管理,磨損均衡和動態(tài)數(shù)據(jù)刷新)更像是直接的錯誤預(yù)防。
有效的校準(zhǔn)過程可以在器件的整個壽命期間保持低誤碼率,同時動態(tài)地適應(yīng)存儲器單元中的閾值電壓的變化。有許多干擾會影響電池的閾值電壓:編程和擦除循環(huán),讀取干擾,數(shù)據(jù)保留溫度變化等。閃存不會自動跟蹤閾值變化。相反,閃存控制器會決定何時需要校準(zhǔn)并執(zhí)行合適的操作序列。
如下所述,校準(zhǔn)改變了電池的參考電壓。由于不同的塊或頁面可能會遇到不同的干擾,因此一頁的最佳校準(zhǔn)不一定適用于另一頁。
此外,諸如磨損均衡(WL),讀干擾管理(RDM),跡近錯失ECC和動態(tài)數(shù)據(jù)刷新(DDR)之類的錯誤預(yù)防機制協(xié)同工作,以管理數(shù)據(jù)到閃存上有效和可靠的傳輸。磨損均衡可確保閃存或存儲系統(tǒng)中的所有塊同時接近其定義的擦除周期預(yù)算,而不是之前接近它的某些塊。讀取干擾管理計算對閃存的所有讀取操作。如果達(dá)到某個閾值,則刷新周圍區(qū)域。跡近錯失ECC刷新應(yīng)用程序讀取的所有數(shù)據(jù)超過配置的錯誤閾值,而動態(tài)數(shù)據(jù)刷新掃描讀取所有數(shù)據(jù)并將所有塊的錯誤狀態(tài)標(biāo)識為后臺操作。如果在此掃描讀取中超過每個塊或ECC單元的特定閾值錯誤,則觸發(fā)刷新操作。這些功能通常由不同的控制器公司以不同的方式命名,并最終以其背后的邏輯和算法為目標(biāo),同時針對共同的目標(biāo),以不同的方式達(dá)到它人們應(yīng)該與他們的控制器公司建立密切的關(guān)系,以便了解這些功能如何與合格的閃光燈協(xié)同工作。
最后,糾錯已經(jīng)成為閃存控制器中最著名和最重要的任務(wù)之一,而錯誤預(yù)防應(yīng)該在其價值方面承擔(dān)更多的重量,錯誤糾正的復(fù)雜性和強度最終使它成為最有價值的蛋糕控制器的機制。在考慮面積和功率限制時,糾錯編碼變得越來越困難。隨著對糾錯能力的需求不斷增加,舊代碼不再能夠基于最新閃存中可用的有限備用區(qū)域來提供所需的校正性能。
為了提供最佳解決方案,海派世通開發(fā)了自己的糾錯引擎,這是一種基于廣義級聯(lián)碼的硬判決和軟判決糾錯模塊。該代碼構(gòu)造提供的巨大優(yōu)勢在于一個特定方面:可以分析地確定每個代碼字中的可校正錯誤的數(shù)量。這意味著對于每個碼字,糾錯可以保證一定程度的校正性能。對于所有可用的閃存,指定了保證誤碼率,可以保證在指定參數(shù)內(nèi)的可靠操作。
當(dāng)數(shù)據(jù)從閃存中讀回并傳遞到糾錯模塊時,判斷哪些位錯誤僅基于添加到碼字中的冗余信息。僅使用此信息意味著對于每個比特,它同樣可能是正確的或不正確的。使用所謂的軟信息考慮概率,其指示接收的比特是接收的比特的可能性或者是否是另一個值(比特可以是“零”或“一個”)的可能性。這些概率取自所謂的對數(shù)似然表(LLR)表,這些表已經(jīng)生成并且已經(jīng)存儲在控制器中的查找表中。使用該信息,糾錯現(xiàn)在具有更多輸入:對于每個單獨的比特,概率信息現(xiàn)在指示該比特被接收的可能性,例如,收到零,有74%的信心,原始值為零。糾錯具有明確的指示,哪些位可能是錯誤的,哪些位不太可能是錯誤的。該附加信息顯著增加了糾錯的糾正能力。
閃存控制器是確保閃存可靠和安全處理的關(guān)鍵組件。它們處理一系列功能,旨在有效地管理閃存上的數(shù)據(jù)傳輸,并且不僅可以進(jìn)行糾錯,還可以防止錯誤。但是,這些功能都是以不同的方式設(shè)計,并且取決于公司的業(yè)務(wù)模式和重點,您的控制器可以做到最低限度。在海派世通,我們稱之為高質(zhì)量的功能,機制和復(fù)雜過程,旨在提高FlashXE?eXtendedEndurance生態(tài)系統(tǒng)的耐用性,從而提高閃存的可靠性。
-
閃存
+關(guān)注
關(guān)注
16文章
1771瀏覽量
114766 -
NAND
+關(guān)注
關(guān)注
16文章
1666瀏覽量
135933
原文標(biāo)題:如何在基于NAND閃存的系統(tǒng)中實現(xiàn)最低的故障率?
文章出處:【微信號:TopStorage,微信公眾號:存儲加速器】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論