12月11日, 在北京國際飯店舉行的2018中國存儲(chǔ)與數(shù)據(jù)峰會(huì)(DATA & STORAGE SUMMIT 2018)上,新華三集團(tuán)存儲(chǔ)產(chǎn)品部總經(jīng)理徐潤安以“閃存新紀(jì)元-- Memory-Driven的存儲(chǔ)新常態(tài)”為題發(fā)表主題演講。以下內(nèi)容根據(jù)速記整理,未經(jīng)本人審定。
新華三存儲(chǔ)產(chǎn)品部總經(jīng)理徐潤安
徐潤安:各位嘉賓大家下午好,感謝鄭總和大會(huì)給新華三一個(gè)機(jī)會(huì)來分享給大家我們對于下一個(gè)存儲(chǔ)紀(jì)元的理解。
大家記得這個(gè)圖嗎?一年前,也是在這個(gè)峰會(huì)上,我們就談到了關(guān)于這一副清明上河圖,一千多年前的生活常態(tài)在現(xiàn)在已經(jīng)發(fā)生了更多的改變,有好事者在網(wǎng)上P了一個(gè)新的清明上河圖。
歲歲年年花相似,年年歲歲人不同,存儲(chǔ)市場也是這個(gè)樣子,可能有客戶的需求從來就沒有變過,我們要的就是更快、更大、更可靠的存儲(chǔ),而實(shí)際上真正承載這樣的一個(gè)技術(shù)的底層的技術(shù),都在不斷的發(fā)生變革和革新。
金光飛航是往返于港珠澳之間基本的交通工具,在之前我們往返于香港、澳門、珠海都要靠船,這個(gè)船很小,如果遇到大風(fēng)浪,我們都經(jīng)常會(huì)停航,船有時(shí)候也非常的顛簸,坐的非常不舒服,但是大家知道在今年,我們在港珠澳之間通行了港珠澳大橋,林總工程師設(shè)計(jì)了這樣一個(gè)港珠澳大橋,把整個(gè)港珠澳之間的通行變得非常的便利,兩岸的同胞們通行起來更加的便利,這成為了港珠澳三地群眾的新的生活常態(tài),一個(gè)大橋改變了所有的東西。當(dāng)然這個(gè)大橋也用到了非常多先進(jìn)的技術(shù)。
傳統(tǒng)的機(jī)械盤到NANASSD、SCM,一直有一個(gè)像港珠澳的延時(shí),非常大,用什么樣的技術(shù)可以抵消這部分的延時(shí)?那就是英特爾和我們給大家?guī)淼?DXpoint,我很自豪的和大家宣布,12月4日這款產(chǎn)品正式的商用,也就是大家可以在新華三的平臺(tái)上享受到SCM(Storage Class Memory)帶來的便利,這樣的技術(shù)真的彌補(bǔ)了延遲之間的差距。
首先SCM的技術(shù)基于兩點(diǎn),一個(gè)是介質(zhì)的技術(shù),另一個(gè)是NVMe。
可以看到NVMe的v1.3最新的版本是17年發(fā)布的,未來所有基于SAS.SATA的協(xié)議都會(huì)被NVMe取代,這個(gè)趨勢是不可逆的,所以很多的平臺(tái)都是NVMe平臺(tái)實(shí)現(xiàn),另外NVMe的生態(tài)系統(tǒng)逐漸的完善,從操作系統(tǒng)、虛機(jī)等等。
我今天想強(qiáng)調(diào)的是NVMe的技術(shù)對SCM提供的更好的舞臺(tái),正是因?yàn)橛辛薔VMe,才可以讓其他的東西真正的發(fā)揮作用。它可以將SAS和SATA之間的瓶頸消除掉,帶來更強(qiáng)的并行處理和輸出的能力,從而改變現(xiàn)在的存儲(chǔ)市場和產(chǎn)品。
新華三是第一個(gè)采用SCM技術(shù)、利用NVMe來實(shí)現(xiàn)的一個(gè)廠商。
來看看NVMe的SCM給大家?guī)砹耸裁春锰??圖的最左側(cè),是傳統(tǒng)的介質(zhì),磁盤,延遲是10毫秒,所有的控制器和軟件延遲都比較高,第一步的變革,就是全閃存時(shí)代的到來,換成了SSD NAND的技術(shù),延遲一下子降到了0.1毫秒,我們可以看到在附加SAS控制器的延遲成本,可以看到NVMe的SSD也會(huì)帶來更進(jìn)一步的延時(shí)的減少,一部分體現(xiàn)在介質(zhì)上,另外一部分體現(xiàn)在控制器和軟件上。SCM,將延時(shí)再下降了十倍,這個(gè)技術(shù)是革命性的,真正的橋接了CPU、MAND和SSD之間的延遲,所以新華三也是HPE在全球第一個(gè)推出了SCM解決的方案。
當(dāng)然,全閃接下來在市場的發(fā)展和系統(tǒng)健壯性方面還有很多的疑問,需要各個(gè)廠家和所有工作者共同努力,就是比如NVMe對于現(xiàn)有的架構(gòu)會(huì)有多大的影響,也是需要我們考慮的。
操作系統(tǒng)的支持,我們需要去考慮,以及社會(huì)的多路徑管理等等,所有的這些技術(shù)我相信在今后的一兩年之內(nèi)會(huì)逐漸的完善起來,然后去滿足客戶的需要。
客戶在選擇所有全閃存的時(shí)候,也可以對這些問題做適當(dāng)?shù)年P(guān)注,當(dāng)然也歡迎給到我們更多的輸入,告訴我們你們更喜歡什么樣的NVMe技術(shù),你們更喜歡什么樣的全閃。
簡單來看,大家最熟悉的NVMe和NANDSSD是很普遍的技術(shù),我們帶來的是NVMeon storageClassMemory,會(huì)有一個(gè)很大的性能改變。
這是我們自己的系統(tǒng)上做的延時(shí)的測試,可以看到整個(gè)的系統(tǒng)的平均延時(shí)下降了50%甚至更低,大家可以看到幾乎所有的I/O都會(huì)在0.3毫秒以內(nèi),95%,這是SCM帶來的真正的價(jià)值,不僅僅是峰值,而是所有的。
SCM下一步的發(fā)展會(huì)是什么樣的?我們的觀點(diǎn)是,在現(xiàn)有這個(gè)階段,SCM將會(huì)被用于數(shù)據(jù)閃存,存儲(chǔ)系統(tǒng)里面的閃存.
隨著SCM的技術(shù)逐漸的進(jìn)一步的完善以及體系架構(gòu)的改變,原數(shù)據(jù)可以更多的存放在SCM上,當(dāng)SCM的成本降到足夠低的時(shí)候,SCM甚至可以將整個(gè)陣列的所有數(shù)據(jù)存放上去,屆時(shí)這就是下一個(gè)閃存紀(jì)元。
總結(jié)我們的方向,首先是SCM,讓Memory-Driven可以給大家?guī)砀嗟母斓难訒r(shí),并行處理的協(xié)議包括NVMe,包括由此帶來的革新性的全閃存的系統(tǒng)。
談到Memory-Driven,大家也可以看一個(gè)例子, DZNE公司采用了我們Memory-Driven的技術(shù)以后整個(gè)的研究成本降低了60%,研究速度提升了一百倍,當(dāng)所有的運(yùn)算不再依靠磁盤介質(zhì),而變成NAND介質(zhì)甚至是SCM介質(zhì)的時(shí)候,帶來的計(jì)算的速度會(huì)成倍的增加,從而帶來成本的進(jìn)一步下降,這是給大家?guī)淼臉I(yè)務(wù)價(jià)值.
所以我們說,新的閃存紀(jì)元不僅僅是要求更多更大的IOPS,可能更快速的響應(yīng),更低的延時(shí)。
今天這個(gè)大會(huì)的主旨“DataIntelligence”,我們的存儲(chǔ)能不能“Intelligence”?給大家分享一個(gè)小例子。
前一段時(shí)間去美國的時(shí)候,我用了導(dǎo)航軟件,因?yàn)楣雀璨豢捎?,所以?dāng)?shù)氐呐笥淹扑]了我用waze,這個(gè)工具非常好的一點(diǎn),除了有我們現(xiàn)在百度高德所有的功能外,它提供的非常豐富的反饋功能,也就是作為用戶可以實(shí)時(shí)反饋你在路上看到的情況,大家知道當(dāng)一條道路顯示紅色的時(shí)候,往往是因?yàn)檫@里的平均車速比較低,但在美國很多的情況是因?yàn)橛蠵arkingload有車停在路邊,也會(huì)導(dǎo)致平均速度降低,駕駛者可把信息提供到軟件上,我這里碰到了事故,整個(gè)系統(tǒng)學(xué)習(xí)了這些數(shù)據(jù)以后,會(huì)反饋給路過這條路上的所有駕駛員,這是一個(gè)擁有反饋機(jī)制的人工智能。
waze還有一個(gè)非常大的好處,因?yàn)榈矫绹粋€(gè)新的城市可能路不是很熟悉,waze就會(huì)做出推薦,他會(huì)問你出行的時(shí)間是什么,如果是中午,他會(huì)給你推薦最適合中午出行的路線,晚上會(huì)推薦你晚上出行的路線,告訴你這條路大概要花多長時(shí)間,它不僅僅是基于現(xiàn)在的數(shù)據(jù),它基于歷史的數(shù)據(jù)驅(qū)分析出來一個(gè)結(jié)果,反饋給有相同使用需求的人。
存儲(chǔ)可不可以?我的答案一定是可以的,我們帶來的系統(tǒng)就是這樣的,首先根據(jù)我們所有的歷史狀況,發(fā)現(xiàn)真正跟存儲(chǔ)相關(guān)的報(bào)錯(cuò)錯(cuò)誤,其實(shí)只有46%和本身存儲(chǔ)有關(guān),更多的是非存儲(chǔ)的原因,比如最佳實(shí)踐和資源沖突以及兼容性的問題,過去往往沒有人關(guān)注這一點(diǎn)。通過人工智能可以把這些問題全都分析出來。
我們InfoSight人工智能系統(tǒng)上線以后一定是一個(gè)閉環(huán),從洞察這些問題,到機(jī)器學(xué)習(xí),然后到預(yù)報(bào),同時(shí)還可以做推薦,還有執(zhí)行,所有的整個(gè)一套系統(tǒng)我們是閉環(huán)進(jìn)行的。這套系統(tǒng)上線以后,85%的問題被自動(dòng)診斷并且解決,5000多個(gè)案子被成功避免,所以新華三的服務(wù)部門非常開心,工作量一下子減少了,當(dāng)然對于客戶而言,79%的日常IT維護(hù)的工作沒有了,可以投入更多精力在IT的創(chuàng)新,而不是復(fù)雜的運(yùn)維。
現(xiàn)在我們已經(jīng)將InfoSight智能系統(tǒng)運(yùn)行到了我們的平臺(tái)上運(yùn)行到了所有HPE服務(wù)器上,也就是說整個(gè)的InfoSight系統(tǒng)已經(jīng)被IT基礎(chǔ)架構(gòu)平臺(tái)上使用,這是簡單使用以后的數(shù)據(jù)。
11倍的高效非常有趣,有一個(gè)客戶有多臺(tái)陣列,但是多臺(tái)陣列之間的負(fù)載是不均衡的,有些陣列用滿了,有些沒有,單用戶本身是不知道的,他也沒有明確的感知,也不知道是哪個(gè)應(yīng)用把哪臺(tái)陣列用滿了。上線InfoSight以后就給了他建議,某幾個(gè)應(yīng)用已經(jīng)遇到了瓶頸,某臺(tái)設(shè)備也遇到了瓶頸,應(yīng)該把一些應(yīng)用和虛機(jī)遷移到另一臺(tái)陣列上,所有的這些工作就可以幫助用戶正確的診斷出系統(tǒng)里真正的問題到底在哪里。
另外我們也是全球首創(chuàng)一個(gè)飽和度的分析結(jié)果,這種分析以前可能是不可想象得,可能我們要咨詢團(tuán)隊(duì)入住用戶的現(xiàn)場待上幾個(gè)月觀察你所有的數(shù)據(jù),現(xiàn)在就是一份報(bào)告,通過我們的InfoSight系統(tǒng),綠線是OK,紅線就是有問題。
不僅僅是讓用戶發(fā)現(xiàn)問題,而且知道故障是什么原因?qū)е碌模约叭绾谓鉀Q。
另外,InfoSight還可以推薦結(jié)果,當(dāng)有客戶在一個(gè)環(huán)境里碰到了問題,并且最終找到了解決方案解決以后,整個(gè)解決方案會(huì)通過這一套智能系統(tǒng)推送到所有有類似環(huán)境的客戶里,告訴他們說有類似的潛在風(fēng)險(xiǎn),需要做一定的升級(jí)或采取一定的措施。
當(dāng)然也有這樣的情況,我最近也碰到一些客戶經(jīng)常會(huì)問我,現(xiàn)在陣列的分布的版本經(jīng)常有更新,那作為一個(gè)客戶我怎么知道現(xiàn)在是不是需要升級(jí)系統(tǒng)?InfoSight可以告訴你,這次版本的升級(jí),升級(jí)了哪幾個(gè)補(bǔ)丁,主要為了修復(fù)哪些環(huán)境上的問題,再檢測環(huán)境里是不是有類似的潛在風(fēng)險(xiǎn),如果有就跟你說你需要升級(jí),如果沒有就說不用。
所以你可以看到整個(gè)有一個(gè)反饋的積極正向的反饋機(jī)制給到用戶,告訴用戶你的系統(tǒng)應(yīng)該怎樣的調(diào)整。
大家看一下我們的性能分析和處理的大概的流程,包括異常的檢測,熱點(diǎn)發(fā)現(xiàn),壓力評估,社區(qū)學(xué)習(xí),存儲(chǔ)的負(fù)載的性能評估,壓力的預(yù)報(bào),未來的性能走向都會(huì)通過InfoSight給到大家一個(gè)分析,這樣讓用戶的存儲(chǔ)更加的智能,不需要花太多的時(shí)間關(guān)心運(yùn)維存儲(chǔ)本身,而可以去關(guān)注業(yè)務(wù)。
這個(gè)是InfoSight上線以后的情況,我們可以直接升級(jí)到L3,小于一分鐘的響應(yīng)時(shí)間,93%的案子會(huì)被自動(dòng)處理,客戶滿意度大大的提升,所有的這些東西智能存儲(chǔ),給我們和客戶帶來了更多的價(jià)值。
所以就像大會(huì)說的一樣,DataIntelligence,包括所有的功能帶給客戶,我相信我們準(zhǔn)備好了,我們一樣把這個(gè)會(huì)帶給大家。
這里是我們整個(gè)新華三的存儲(chǔ)家族,都會(huì)被InfoSight覆蓋,變成一個(gè)智能的IT設(shè)備,我們一直在前行。
評論
查看更多