0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

分區(qū)存儲助力QLC應(yīng)用到嵌入式存儲設(shè)備

江波龍電子 ? 2023-02-22 14:12 ? 次閱讀

目前應(yīng)用在移動終端的嵌入式存儲設(shè)備(這里主要指UFS/eMMC等,以下統(tǒng)稱“嵌入式存儲設(shè)備”)中主流介質(zhì)還是TLC。但更高存儲密度的QLC也已經(jīng)產(chǎn)品化,比如一些數(shù)據(jù)中心(讀密集型應(yīng)用)已經(jīng)在部署QLC存儲設(shè)備。QLC可以給存儲設(shè)備帶來更低的成本,作為消費級產(chǎn)品的嵌入式存儲設(shè)備,未來引入QLC也是勢在必行。

但和當(dāng)前主流TLC相比,QLC在性能和壽命上都相差很大,從下面某原廠TLC和QLC在性能和壽命方面的一個對比可見一斑。

14081c4a-b213-11ed-ad0d-dac502259ad0.jpg

(Table 1:某原廠TLC和QLC性能和壽命對比)

因此,QLC要應(yīng)用在嵌入式存儲設(shè)備上,首先需要解決性能差和壽命短兩大問題。

雖然QLC還不到TLC的1/4寫入性能,但目前消費級固態(tài)存儲產(chǎn)品都有成熟的SLC cache機制,能保證用戶有比較好的突發(fā)寫入性能(寫SLC的性能)。由于嵌入式存儲設(shè)備有比較充裕的空閑時間,存儲設(shè)備可以利用空閑時間把數(shù)據(jù)從SLC搬到QLC,只要不是重度寫入場景,這部分QLC寫入性能,用戶一般感知不到。

但數(shù)據(jù)一旦寫到QLC,對比TLC,用戶讀取性能變差。針對這個讀取性能差的問題,有一種方案是把熱數(shù)據(jù)(經(jīng)常讀?。懟豐LC,但這樣無疑增加了設(shè)備復(fù)雜性,而且數(shù)據(jù)搬移帶來了額外的寫放大,這讓壽命本來就不長的QLC“雪上加霜”。

如果說性能問題可以通過SLC解決或者緩解,那對于QLC壽命問題,在分區(qū)存儲引入之前,可能的解決方案有:用戶端使用類F2FS文件系統(tǒng)使用數(shù)據(jù)分流。

F2FS文件系統(tǒng)化隨機寫為順序?qū)?,這會減少存儲設(shè)備內(nèi)部垃圾回收導(dǎo)致的寫放大,但F2FS文件系統(tǒng)本身的垃圾回收,會給存儲設(shè)備帶來額外的寫。綜合下來,F(xiàn)2FS文件系統(tǒng)給設(shè)備帶來的寫放大不一定減少。

數(shù)據(jù)分流需要主機和設(shè)備配合:主機端對數(shù)據(jù)進(jìn)行冷熱甄別,設(shè)備端根據(jù)數(shù)據(jù)的冷熱程度把它們存儲在不同的閃存塊上。數(shù)據(jù)分流能一定程度上減少存儲設(shè)備寫放大,但具體能帶來多大收益,這取決于用戶冷熱數(shù)據(jù)的比例,因此有一定的局限性。

今天要介紹減小寫放大的終極大招——分區(qū)存儲(Zoned Storage),它能消除QLC和TLC壽命之間的差異,而且能提升存儲設(shè)備性能,讓QLC應(yīng)用到嵌入式存儲設(shè)備上變得可能。

什么是分區(qū)存儲?

分區(qū)存儲概念最早來源于SMR HDD。SMR是“Shingled Magnetic Recording”(疊瓦式磁記錄)的首字母縮寫,是一種用于增加容量并降低硬盤每TB成本的重要技術(shù)。SMR硬盤把硬盤分成一個個的分區(qū)(Zone),每個分區(qū)內(nèi)部必須順序?qū)?/strong>,否則會發(fā)生數(shù)據(jù)覆蓋從而導(dǎo)致之前寫入的數(shù)據(jù)丟失問題。

1433d402-b213-11ed-ad0d-dac502259ad0.jpg

(Figure 1:SMR HDD)

分區(qū)存儲設(shè)備的邏輯空間被劃分成一個個連續(xù)的分區(qū),分區(qū)內(nèi)部只能被順序?qū)懭搿C總€分區(qū)都有一個寫指針,用于跟蹤下一次寫入的位置。分區(qū)中的數(shù)據(jù)不能被覆蓋,必須首先使用特殊命令(區(qū)域重置)擦除數(shù)據(jù)。

14634caa-b213-11ed-ad0d-dac502259ad0.jpg

(Figure 2:分區(qū)存儲概念)

除了HDD,基于閃存的固態(tài)存儲設(shè)備,也是非常喜歡順序?qū)懭氲?,因為順序?qū)懶阅芎?,而且?dǎo)致的寫放大也小?!白屩鳈C端順序?qū)懭搿币恢笔枪虘B(tài)存儲設(shè)備的夢想,在SMR HDD助力下,分區(qū)存儲生態(tài)日趨完善,NVMe也制定了ZNS(Zoned Namespace)標(biāo)準(zhǔn),SSD也算是“圓夢”了。

分區(qū)存儲帶來的好處

分區(qū)存儲帶來的一大好處就是能消除存儲設(shè)備內(nèi)部的垃圾回收。存儲設(shè)備垃圾回收會導(dǎo)致兩個主要問題:一是引入寫放大,導(dǎo)致存儲設(shè)備壽命減少;二是垃圾回收的同時如果伴有主機讀寫,垃圾回收操作則會影響主機讀寫性能。

14775862-b213-11ed-ad0d-dac502259ad0.jpg

(Figure 3:垃圾回收示例)

垃圾回收原理:為騰出空閑閃存塊,需要把有效數(shù)據(jù)A、B、C從源閃存數(shù)據(jù)塊搬到新的閃存塊,內(nèi)部數(shù)據(jù)的搬移引入寫放大。寫放大 = 寫入閃存的數(shù)據(jù)量/主機寫入的數(shù)據(jù)量,寫放大越大,對閃存磨損越厲害。

分區(qū)存儲怎么就能消除存儲設(shè)備垃圾回收的呢?

如果分區(qū)大小是存儲設(shè)備閃存塊大小的整數(shù)倍,這樣一個分區(qū)的數(shù)據(jù)會被寫到閃存設(shè)備的整數(shù)個閃存塊內(nèi)。由于分區(qū)不允許覆蓋寫,一個分區(qū)數(shù)據(jù)只能被整體無效掉,也就是意味著該分區(qū)對應(yīng)的閃存塊也是整體被無效掉(上面沒有任何有效數(shù)據(jù)),因此存儲設(shè)備內(nèi)部回收閃存塊無需垃圾回收——只需要一個擦除動作。

傳統(tǒng)垃圾回收由于需要搬移閃存塊上的有效數(shù)據(jù),會導(dǎo)致寫放大。還有,為減小寫放大和加速垃圾回收,存儲設(shè)備都會預(yù)留一些閃存空間(也就是我們常說的OP),以減少閃存塊上有效數(shù)據(jù)數(shù)量。現(xiàn)在分區(qū)存儲設(shè)備中由于不存在垃圾回收,因此沒有寫放大,同時這部分OP也可以省掉了(節(jié)省成本)。

1494a930-b213-11ed-ad0d-dac502259ad0.jpg

(Figure 4:傳統(tǒng)SSD數(shù)據(jù)存放和分區(qū)SSD數(shù)據(jù)存放比較)

分區(qū)存儲帶來的另一大好處就是大大減少了映射表大小,從而提升系統(tǒng)性能,減少存儲設(shè)備成本。

基于閃存的傳統(tǒng)存儲設(shè)備一般按4KB邏輯塊大小為映射粒度,其L2P映射表(邏輯地址到物理地址的映射)大小一般為存儲設(shè)備容量的1/1024,比如一個512GB的UFS設(shè)備,其L2P映射表大小為512MB。企業(yè)級SSD一般都配有相應(yīng)大小的DRAM來存儲運行時的L2P映射表,比如512GB的企業(yè)級SSD需要搭載至少512MB的DRAM;而業(yè)界消費級存儲設(shè)備則是出于成本考慮,一般都沒有DRAM,它利用控制器小的SRAM緩存部分L2P映射表,而絕大多數(shù)L2P映射表都是存在閃存,固件按需從閃存加載映射關(guān)系數(shù)據(jù)到控制器SRAM。這種DRAM-less的存儲設(shè)備,與帶DRAM的存儲設(shè)備相比,少了DRAM的成本,但性能無疑會大打折扣,因為控制器SRAM大小有限,對隨機讀取場景來說,映射表緩存命中率很低,固件很多時候需要先從閃存加載映射關(guān)系,然后再根據(jù)獲得的物理地址去讀用戶數(shù)據(jù),也就是說讀取一筆數(shù)據(jù)需要訪問幾次閃存,意味著讀取性能肯定比只訪問一次閃存要慢得多。

問題的根因是傳統(tǒng)存儲設(shè)備映射粒度太細(xì)了,導(dǎo)致映射表巨大。而分區(qū)存儲設(shè)備,我們可以按照分區(qū)大小為映射粒度。假設(shè)分區(qū)大小為128MB,一個512GB的設(shè)備有4096個分區(qū),每個分區(qū)對應(yīng)的物理地址用4字節(jié)表示,那么整個L2P映射表只有16KB!這么小的映射表完全可以存儲在控制器SRAM中,因此在企業(yè)級SSD中可節(jié)省DRAM的使用;對消費級存儲產(chǎn)品來說,L2P映射表可以常駐內(nèi)存,無需從閃存中獲取映射關(guān)系,讀取一筆數(shù)據(jù)只需訪問一次閃存,這大大加速了隨機讀取性能。

14c714a6-b213-11ed-ad0d-dac502259ad0.jpg

(Table 2:傳統(tǒng)存儲設(shè)備和分區(qū)存儲設(shè)備映射對比)

分區(qū)存儲助力QLC嵌入式存儲設(shè)備

回到QLC應(yīng)用到嵌入式存儲設(shè)備的話題

在傳統(tǒng)嵌入式存儲設(shè)備中,垃圾回收一般會引入3-4的寫放大,即一個3000次擦寫次數(shù)的TLC閃存,真正給到用戶的擦寫次數(shù)可能不到1000次。而分區(qū)存儲的使用,由于不存在垃圾回收,因此寫放大可以做到接近1,也就是一個1500次擦寫次數(shù)的QLC,給到用戶就是實打?qū)嵉?500次。這意味著:傳統(tǒng)用3000次擦寫次數(shù)TLC的存儲設(shè)備,假設(shè)TBW為100TB,現(xiàn)在如果用QLC,雖然QLC的擦寫次數(shù)只有TLC的一半,但由于分區(qū)存儲的使用,TBW反而能提升到150TB。

對分區(qū)存儲設(shè)備,由于L2P映射表很小,完全能夠存放在控制器SRAM,因此可快速更新和獲取映射關(guān)系,從而大幅提升系統(tǒng)讀寫性能。傳統(tǒng)基于TLC的嵌入式存儲設(shè)備,在隨機讀取一筆數(shù)據(jù)(4KB)的時候,由于L2P映射緩存很?。◣装貹B),固件大概率要先從閃存上加載L2P映射關(guān)系,這個時間大概40us左右,然后再花60us左右的時間從閃存加載用戶數(shù)據(jù)——隨機讀取一筆數(shù)據(jù)的時間大概需要花100us左右;而現(xiàn)在基于分區(qū)存儲的嵌入式存儲設(shè)備,由于省掉了加載映射關(guān)系的時間,雖然讀取閃存的時間QLC要比TLC長,但總的時間下來,兩者是相當(dāng)?shù)摹?/strong>

由于分區(qū)存儲設(shè)備的使用,再加上成熟的SLC緩存機制,這兩大特性彌補了QLC壽命短和性能差兩大短板,讓QLC應(yīng)用到嵌入式存儲設(shè)備上變得可行?,F(xiàn)在典型的嵌入式存儲設(shè)備為UFS設(shè)備,如果引入了分區(qū)存儲,像UFS中的HPB、FBO等特性完全可以拋棄,這也無疑簡化了UFS設(shè)備的設(shè)計。

嵌入式存儲設(shè)備技術(shù)展望

前端接口協(xié)議方面,應(yīng)用于安卓平臺上的嵌入式存儲設(shè)備當(dāng)前主流是UFS設(shè)備,相信未來很長一段時間也會沿著UFS路線繼續(xù)向前。UFS4.0協(xié)議今年8月份發(fā)布,三星早前也發(fā)布了UFS4.0存儲設(shè)備。

14e78484-b213-11ed-ad0d-dac502259ad0.jpg

(Figure 5:嵌入式存儲協(xié)議發(fā)展路線)

存儲介質(zhì)方面,作為消費級產(chǎn)品,嵌入式存儲設(shè)備對成本敏感,隨著QLC閃存的成熟,QLC必然會應(yīng)用到未來的嵌入式存儲設(shè)備上,無論是廠商還是消費者,都要做好這個心理準(zhǔn)備。事實上,今年(2022年)年初鎧俠已經(jīng)發(fā)布了基于QLC的UFS3.1產(chǎn)品。

QLC應(yīng)用到嵌入式存儲設(shè)備上,要讓消費者用得放心,這需要相關(guān)的技術(shù)來解決QLC介質(zhì)可靠性差、壽命短、性能差等問題。因此在技術(shù)趨勢方面,一方面是嵌入式存儲控制器糾錯能力需要變得越來越強;另一方面,像數(shù)據(jù)分流、分區(qū)存儲這些能減小寫放大的技術(shù)也會被引入,來彌補QLC壽命短這塊短板。

目前,江波龍具有基于主流3D TLC閃存的豐富的嵌入式存儲產(chǎn)品,從eMMC到高性能UFS3.1,從消費級存儲到車規(guī)級存儲,產(chǎn)品矩陣全面。同時,公司也在思考怎么把存儲密度更高的QLC應(yīng)用到嵌入式存儲產(chǎn)品上,并開展相關(guān)技術(shù)預(yù)研工作。未來,江波龍會持續(xù)給客戶帶來更多超越期望的嵌入式存儲產(chǎn)品。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 嵌入式
    +關(guān)注

    關(guān)注

    5059

    文章

    18973

    瀏覽量

    302032
  • 存儲
    +關(guān)注

    關(guān)注

    13

    文章

    4226

    瀏覽量

    85575
收藏 人收藏

    評論

    相關(guān)推薦

    【「嵌入式Hypervisor:架構(gòu)、原理與應(yīng)用」閱讀體驗】+ 了解Hypervisor

    正值舉國歡度國慶佳節(jié)之際,我收到了《嵌入式Hypervisor:架構(gòu)、原理與應(yīng)用》一書,在此感謝電子發(fā)燒友論壇!當(dāng)初申請評測此書之時,我根本就不知道這個Hypervisor是什么,只是看到有嵌入式
    發(fā)表于 10-13 16:47

    嵌入式主板是什么意思?嵌入式主板全面解析

    嵌入式主板,通常被稱為嵌入式系統(tǒng)的核心組件,是一種用于控制和數(shù)據(jù)處理的計算機硬件,其設(shè)計旨在嵌入特定設(shè)備中執(zhí)行專門任務(wù)。嵌入式主板如同是
    的頭像 發(fā)表于 09-30 10:05 ?314次閱讀

    嵌入式系統(tǒng)的未來趨勢有哪些?

    (ML)技術(shù)的快速發(fā)展,嵌入式系統(tǒng)將更多地整合這些先進(jìn)技術(shù),以支持智能決策和自動化。在設(shè)備上直接運行AI和ML模型,進(jìn)行圖像識別、自然語言處理、預(yù)測分析等任務(wù),將極大提升嵌入式系統(tǒng)的智能化水平。比如說在
    發(fā)表于 09-12 15:42

    使用 TMP1826 嵌入式 EEPROM 替換用于模塊識別的外部存儲

    電子發(fā)燒友網(wǎng)站提供《使用 TMP1826 嵌入式 EEPROM 替換用于模塊識別的外部存儲器.pdf》資料免費下載
    發(fā)表于 09-09 09:44 ?0次下載
    使用 TMP1826 <b class='flag-5'>嵌入式</b> EEPROM 替換用于模塊識別的外部<b class='flag-5'>存儲</b>器

    嵌入式linux開發(fā)的基本步驟有哪些?

    之前,首先需要選擇合適的硬件平臺。硬件選擇需要考慮以下幾個方面: 1.1 處理器 嵌入式Linux開發(fā)需要一個處理器,常見的處理器有ARM、MIPS、PowerPC等。選擇處理器時,需要考慮處理器的性能、功耗、成本等因素。 1.2 存儲
    的頭像 發(fā)表于 09-02 09:11 ?345次閱讀

    EVASH Ultra EEPROM:助力ChatGPT等AI應(yīng)用的嵌入式存儲解決方案

    EVASH Ultra EEPROM:助力ChatGPT等AI應(yīng)用的嵌入式存儲解決方案
    的頭像 發(fā)表于 06-26 18:13 ?815次閱讀

    佰維存儲發(fā)布工規(guī)級寬溫LPDDR4X嵌入式存儲芯片

    在工業(yè)領(lǐng)域?qū)Ω咝阅?b class='flag-5'>存儲需求日益增長的背景下,佰維存儲近日重磅推出了其全新的工規(guī)級寬溫LPDDR4X嵌入式存儲芯片。這款芯片以其卓越的性能和廣泛的適用性,再次刷新了工業(yè)
    的頭像 發(fā)表于 05-11 14:34 ?817次閱讀

    嵌入式系統(tǒng)軟硬件基礎(chǔ)知識大全

    嵌入式系統(tǒng)是現(xiàn)代科技發(fā)展的一個重要分支,廣泛應(yīng)用于工業(yè)控制、消費電子、醫(yī)療設(shè)備、汽車電子等領(lǐng)域。本文試圖全面解析嵌入式系統(tǒng)的軟基礎(chǔ)知識,以期讓讀者對這一技術(shù)有更深入的了解。嵌入式系統(tǒng)是
    發(fā)表于 05-09 14:12

    佰維存儲推出工規(guī)級寬溫LPDDR4X嵌入式存儲芯片

    近日,佰維存儲重磅推出了工規(guī)級寬溫LPDDR4X嵌入式存儲芯片。這款芯片憑借其出色的性能,傳輸速率飆升至4266Mbps,同時容量靈活多變,從2GB到8GB均可選擇。令人矚目的是,它能在極端溫度條件下穩(wěn)定運行,適應(yīng)-40℃至95
    的頭像 發(fā)表于 05-06 15:47 ?471次閱讀

    佰維存儲發(fā)布了工規(guī)級寬溫LPDDR4X嵌入式存儲芯片

    近日,佰維存儲發(fā)布了工規(guī)級寬溫LPDDR4X嵌入式存儲芯片,該產(chǎn)品傳輸速率高達(dá)4266Mbps,容量覆蓋2GB~8GB,可適應(yīng)-40℃~95℃寬溫工作環(huán)境;
    的頭像 發(fā)表于 05-06 10:06 ?477次閱讀

    嵌入式系統(tǒng)的外設(shè)器件選擇

    ,都可視系統(tǒng)的實際需求來進(jìn)行選擇。本文將為您介紹上述外設(shè)器件的類型與選擇的考慮要素。 存儲器的種類眾多且特性不同 存儲器 在嵌入式系統(tǒng)中,[存儲器]是一個關(guān)鍵的器件,它用于
    的頭像 發(fā)表于 05-05 09:38 ?799次閱讀
    <b class='flag-5'>嵌入式</b>系統(tǒng)的外設(shè)器件選擇

    入門嵌入式系統(tǒng)這些知識你知道嗎?

    嵌入式系統(tǒng)是一種專用的計算機系統(tǒng),作為裝置或設(shè)備的一部分。通常,嵌入式系統(tǒng)是一個控制程序存儲在ROM中的嵌入式處理器控制板。事實上,所有帶有
    發(fā)表于 05-03 09:54 ?504次閱讀

    什么是嵌入式系統(tǒng)?嵌入式系統(tǒng)的具體應(yīng)用

    嵌入式,一般是指嵌入式系統(tǒng)。用于控制、監(jiān)視或者輔助操作機器和設(shè)備的裝置。
    的頭像 發(fā)表于 12-20 13:33 ?2341次閱讀

    嵌入式系統(tǒng)Nor Flash引導(dǎo)存儲器和固件存儲有何關(guān)系?

    嵌入式系統(tǒng)需要可靠且快速的引導(dǎo)存儲器來在系統(tǒng)啟動期間加載初始引導(dǎo)代碼和操作系統(tǒng)。
    的頭像 發(fā)表于 12-05 14:08 ?665次閱讀

    分區(qū)存儲助力QLC應(yīng)用到嵌入式存儲設(shè)備

    分區(qū)存儲助力QLC應(yīng)用到嵌入式存儲
    的頭像 發(fā)表于 11-27 17:44 ?486次閱讀
    <b class='flag-5'>分區(qū)</b><b class='flag-5'>存儲</b><b class='flag-5'>助力</b><b class='flag-5'>QLC</b><b class='flag-5'>應(yīng)用到</b><b class='flag-5'>嵌入式</b><b class='flag-5'>存儲</b><b class='flag-5'>設(shè)備</b>