0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

10Gb每秒!SM4的單核“心”!海泰攜手海量數(shù)據(jù)安全“閃”護(hù)

焦點(diǎn)訊 ? 來源:焦點(diǎn)訊 ? 作者:焦點(diǎn)訊 ? 2022-12-06 14:49 ? 次閱讀

1. 引言

密碼技術(shù)是保護(hù)網(wǎng)絡(luò)信息系統(tǒng)安全的核心技術(shù),已經(jīng)廣泛應(yīng)用到金融、能源、通信、交通、水利等各行各業(yè),為國家安全和經(jīng)濟(jì)發(fā)展發(fā)揮重要作用。商用密碼應(yīng)用安全性評估(簡稱密評),是指在釆用商用密碼技術(shù)、產(chǎn)品和服務(wù)集成建設(shè)的網(wǎng)絡(luò)和信息系統(tǒng)中對密碼應(yīng)用的合規(guī)性、正確性和有效性等進(jìn)行評估。對信息系統(tǒng)開展密評是規(guī)范密碼應(yīng)用、維護(hù)網(wǎng)絡(luò)空間安全的基本要求,同時又可促進(jìn)國產(chǎn)密碼在各個行業(yè)的廣泛應(yīng)用。

隨著應(yīng)用場景的多元化,對密碼算法的性能及安全性需求提出了不同要求,尤其是應(yīng)用最為廣泛的SM4密碼算法。例如,網(wǎng)絡(luò)和通信安全需要采用密碼技術(shù)對通信過程中的敏感數(shù)據(jù)做機(jī)密性保護(hù),這對SM4算法高性能實(shí)現(xiàn)提出了具體需求,否則會對系統(tǒng)的性能造成較明顯的損耗,影響網(wǎng)絡(luò)通信能力。另一方面,多路視頻高清和超高清監(jiān)控數(shù)據(jù)需要超高性能的密碼算法進(jìn)行保護(hù),否則可能影響方案的可實(shí)施性。此外,還有很多行業(yè)對加密存儲提出了高性能需求。近些年來Intel、AMD處理器廠商紛紛宣布在其處理器上推出用于AES加解密的AES-NI指令集,這使得采用AES-NI指令集實(shí)現(xiàn)AES算法的性能得到進(jìn)一步提升。目前SM4算法性能與AES算法相比有一定差距,特別是與AES-NI加速指令的差距更加明顯,若不盡快補(bǔ)齊性能短板,必將影響國密算法的廣泛應(yīng)用。

2. SM4算法實(shí)現(xiàn)介紹

SM4分組密碼算法是我國的商用分組密碼算法,分組長度為128比特,密鑰長度也是128比特,加密算法與密鑰擴(kuò)展算法都采用32輪廣義Feistel結(jié)構(gòu)進(jìn)行迭代,解密算法與加密算法的結(jié)構(gòu)相同,只是輪密鑰的使用順序相反。

為了高效地實(shí)現(xiàn)SM4算法,國內(nèi)外眾多學(xué)者提出了多種軟硬件工程實(shí)現(xiàn)思路。早期的SM4軟件實(shí)現(xiàn)方法僅限于查表實(shí)現(xiàn),但因SM4算法架構(gòu)等因素,其查表實(shí)現(xiàn)的性能明顯低于AES算法。國內(nèi)外許多學(xué)者嘗試采用SIMD技術(shù)應(yīng)用到密碼算法的軟件快速實(shí)現(xiàn)中,例如SSE指令集、AVX指令集等。SIMD可實(shí)現(xiàn)一條指令操作多個數(shù)據(jù),是CPU基本指令集的擴(kuò)展,用于提供數(shù)據(jù)的并行操作,如數(shù)字圖像處理。學(xué)者們將SSE指令與比特切片等技術(shù)應(yīng)用到密碼算法以提高算法的實(shí)現(xiàn)性能。中科院軟件所[1]利用SIMD技術(shù)優(yōu)化實(shí)現(xiàn)SM4算法,該方法相比于查表方法,其軟件實(shí)現(xiàn)性能可以提高85%至138%。北航軟件開發(fā)環(huán)境國家重點(diǎn)實(shí)驗(yàn)室 [2]簡化S盒,采用比特切片技術(shù),結(jié)合AVX指令實(shí)現(xiàn)SM4算法的256個分組并行加解密,實(shí)現(xiàn)效率提高了43%。2014年,Intel公司[3]提出了基于AES-NI指令集實(shí)現(xiàn)SM4的專利,2017年,道里云公司[4]也公開發(fā)表了使用AES-NI指令集實(shí)現(xiàn)SM4的另一種方案。

另外,也有借助硬件GPU進(jìn)行SM4加速實(shí)現(xiàn)的方案。北京電科院[5]通過研究最優(yōu)明文數(shù)據(jù)塊、GPU存儲類型和線程塊對SM4加密的加速比,提出GPU并行SM4加解密方案,將性能提升到25倍左右。中國工業(yè)控制系統(tǒng)網(wǎng)絡(luò)應(yīng)急響應(yīng)小組[6]利用CUDA提出了SM4的CPU-GPU方案,并引入頁鎖內(nèi)存和CUDA流方案使得SM4的速度提升到88倍左右。以上兩篇文章都指出,當(dāng)明文數(shù)據(jù)塊較小時(如小于8KB),由于CPU和GPU之間的數(shù)據(jù)交互傳輸耗時以及小數(shù)據(jù)包時GPU無法調(diào)用全部的計算單元參與運(yùn)算,使得GPU方案的效率可能不升反降,因此應(yīng)用場景有一定的局限性。此外,GPU本身的性能也與加速效果強(qiáng)相關(guān)。

3. 10Gb每秒!海泰的新篇章!

作為一家以密碼為基因、以創(chuàng)新為驅(qū)動的企業(yè),海泰方圓持續(xù)重視研發(fā)投入,2022年,公司研發(fā)中心和技術(shù)體系啟新,全新的“密碼技術(shù)融合創(chuàng)新中心”和“數(shù)據(jù)智能安全工程中心”隆重啟用。公司以密碼技術(shù)融合創(chuàng)新中心為依托,加速布局密碼業(yè)務(wù),深化技術(shù)創(chuàng)新研究,深耕國密算法高性能實(shí)現(xiàn),基于國內(nèi)外研究成果進(jìn)行SM4的軟件高性能實(shí)現(xiàn)研究。

重點(diǎn)針對CPU流水線和不同類型的SIMD的深入理解和分析,結(jié)合SSE、AVX指令集的并行化實(shí)現(xiàn)特點(diǎn)以及對SM4性能優(yōu)化的改善程度,剖析不同工作模式的可并行性以及對并行加解密性能的改善情況,設(shè)計出高性能的SM4并行實(shí)現(xiàn)方法。此外,設(shè)計的SM4高性能實(shí)現(xiàn)自適應(yīng)匹配技術(shù)以及內(nèi)置智能最優(yōu)解方案模塊,可根據(jù)監(jiān)測的CPU架構(gòu)特征自適應(yīng)地匹配符合CPU特征的高性能加解密方案,自動快速搜尋局部最優(yōu)解,使得加解密性能達(dá)盡可能達(dá)到局部最優(yōu)。該方案已部署在SM4算法的五種常見工作模式中,在英特爾十一代I5處理器上優(yōu)化部署后的SM4軟件高性能實(shí)現(xiàn)方案性能從原有的3.54Gbps(百萬比特每秒)提升至7.36Gbps,性能為原方案的2.08倍;在英特爾的十一代I7處理器上進(jìn)行單線程性能測試,ECB模式的加密和解密速度達(dá)到10 Gbps,CTR模式的加解和解密性能不低于9 Gbps,CBC模式和CFB模式的解密性能也都超過9 Gbps,如下圖。

c287e0cff80340dcb3c2e114ddd279b7~noop.image?_iz=58558&from=article.pc_detail&x-expires=1670914118&x-signature=R9CH353pUWONb46TYMJPYgMSlbY%3D

圖2 海泰SM4高性能密碼實(shí)現(xiàn)方案的性能

SM4實(shí)現(xiàn)方案除了已經(jīng)支持上述五種常見工作模式之外,其它更多的工作模式也正在全力支持中。此外,在海泰的密碼技術(shù)融合創(chuàng)新中心,SM4算法高性能實(shí)現(xiàn)還在進(jìn)行持續(xù)迭代,多種模式的實(shí)驗(yàn)室測試數(shù)據(jù)均在10 Gbps以上。

4. 高性能SM4的應(yīng)用

在大數(shù)據(jù)時代,海量數(shù)據(jù)需要進(jìn)行安全防護(hù),隨著技術(shù)的迭代,多種新型存儲技術(shù)快速發(fā)展,傳統(tǒng)150MB/s(百萬字節(jié)每秒)左右存儲速度的HDD硬盤已經(jīng)開始逐漸向更加快速的可達(dá)到500MB/s的固態(tài)硬盤SSD存儲技術(shù)轉(zhuǎn)變,甚至PCIe/M.2 SSD的速度范圍可以達(dá)到1.0GB/s到2.0GB/s。這使得存儲技術(shù)已不再是制約海量數(shù)據(jù)安全存儲的短板了,而SM4密碼算法傳統(tǒng)的軟件實(shí)現(xiàn)方案不足1Gbps(125MB/s),即使高性能硬件加密卡的4Gbps(500MB/s)的加解密速度也只能剛好與普通SSD的性能持平。以上數(shù)字都清晰地指出SM4加解密速度已經(jīng)成為海量數(shù)據(jù)安全存儲的瓶頸,嚴(yán)重制約商密算法的應(yīng)用,特別是在海量數(shù)據(jù)安全存儲等應(yīng)用場景。因此,市場迫切需要更高效的SM4算法,避免將國密算法置入性能瓶頸的尷尬之地。

海泰SM4算法的高性能實(shí)現(xiàn),使得單線程的加解密速度可達(dá)到10Gbps(1.25GB/s),多線程可達(dá)到100Gbps以上,這使得海量數(shù)據(jù)的安全存儲和安全“閃”存得以實(shí)現(xiàn)。

此外,幾乎所有的數(shù)據(jù)密集型應(yīng)用場景都將是海泰高性能SM4算法大顯身手之處。當(dāng)前,移動應(yīng)用、AI應(yīng)用、AR/VR、云手機(jī)、物聯(lián)網(wǎng)、車聯(lián)網(wǎng)等新型應(yīng)用、智能物聯(lián)網(wǎng)應(yīng)用爆發(fā)式增長,更加多樣化的算力產(chǎn)生在云上,提供個性化服務(wù),改變?nèi)藗兊纳?,這些應(yīng)用場景要求簡化現(xiàn)有IT基礎(chǔ)架構(gòu),優(yōu)化服務(wù)器資源利用率,提高系統(tǒng)可用性,這是海泰密碼技術(shù)賦能高質(zhì)量密碼供給,確保數(shù)據(jù)安全的重要應(yīng)用領(lǐng)域。

與此同時,海泰高性能SM4也與相關(guān)密碼產(chǎn)品進(jìn)行對接集成,支持更多的密碼產(chǎn)品,為更多的安全產(chǎn)品賦能更高性能的國密算法實(shí)現(xiàn),提供更加完善的安全功能,為云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)、移動互聯(lián)、工業(yè)控制、人工智能等領(lǐng)域提供更加完善的安全服務(wù)。

5. 總結(jié)與展望

如今,海泰正全面開展國產(chǎn)密碼算法系列的高性能實(shí)現(xiàn),不僅進(jìn)一步優(yōu)化SM4算法性能,還在進(jìn)行SM3算法、SM2算法、SM9算法、ZUC算法的高性能實(shí)現(xiàn),將商密算法的高性能實(shí)現(xiàn)延展到國產(chǎn)化平臺,助力國產(chǎn)化安全。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 密碼技術(shù)
    +關(guān)注

    關(guān)注

    0

    文章

    22

    瀏覽量

    7565
  • SM4算法
    +關(guān)注

    關(guān)注

    0

    文章

    3

    瀏覽量

    1525
  • SM4
    SM4
    +關(guān)注

    關(guān)注

    0

    文章

    4

    瀏覽量

    2432
收藏 人收藏

    評論

    相關(guān)推薦

    有個工業(yè)設(shè)備controlller里面裝的迪1GB CF工業(yè)內(nèi)存卡壞了,無論怎么還原數(shù)據(jù)都無法進(jìn)入WINCE

    1、工業(yè)設(shè)備controlller帶有一個簡單的顯示面板,controlller插入1張1GB迪CF大卡,控制器帶有WINCE5.0的運(yùn)行環(huán)境 2、訪問CF卡,可以看到CF卡帶
    發(fā)表于 08-16 20:55

    招募開啟!思首批星閃開發(fā)者體驗(yàn)官招募,星手機(jī)等你拿!

    無效。 4. 作品評選:(10月11日-11月15日) 本次活動采用積分排名制,參考統(tǒng)一技術(shù)標(biāo)準(zhǔn),由星專家評委對您提交的案例作品綜合評選出以下獎項(xiàng): 1) 卓越星體驗(yàn)官獎 :按評選
    發(fā)表于 06-25 15:39

    使用UC/GUI3.90圖形庫,顯示實(shí)時數(shù)據(jù)時一直屏怎么解決?

    如題:用UC/GUI做的一個界面,里面有一些功能是實(shí)時顯示數(shù)據(jù)的(如:時間,溫度等等) 然后每秒刷新一次數(shù)據(jù),但是整個界面就會有幾條黑線一
    發(fā)表于 04-29 07:03

    《魔獸世界》未采用生成式AI,利用機(jī)器學(xué)習(xí)實(shí)現(xiàn)護(hù)甲套裝配置

    同時,特還談及了團(tuán)隊(duì)利用機(jī)器學(xué)習(xí)進(jìn)行實(shí)驗(yàn)的情況。得益于此,《魔獸世界》的 24 個種族已配備新護(hù)甲套裝?!按饲?,我們的美術(shù)師需為每個角色設(shè)計單獨(dú)護(hù)甲,再依身高、體態(tài)、犄角乃至尾巴等特點(diǎn)進(jìn)行修改。這顯然并不輕松?!?/div>
    的頭像 發(fā)表于 04-03 11:38 ?226次閱讀

    北斗短報文手持終端如何確保數(shù)據(jù)安全性?

    北斗短報文手持終端支持的加密算法主要包括SM4算法和AES算法。SM4算法是一種對稱加密算法,由國家密碼管理局頒布為國家商用密碼算法,被廣泛應(yīng)用于無線通信、有線通信、數(shù)字存儲媒體、智能卡等領(lǐng)域。
    的頭像 發(fā)表于 03-12 17:35 ?497次閱讀

    10kv電纜護(hù)層保護(hù)器如何選擇

      在電力系統(tǒng)中,10kv電纜護(hù)層保護(hù)器發(fā)揮著至關(guān)重要的作用。為了確保電纜的安全穩(wěn)定運(yùn)行,選擇合適的護(hù)層保護(hù)器至關(guān)重要。
    的頭像 發(fā)表于 12-19 09:03 ?317次閱讀

    【先楫HPM5361EVK開發(fā)板試用體驗(yàn)】3手把手實(shí)戰(zhàn)安全數(shù)據(jù)處理器 SDP

    Data Platform)還具備許多其他的功能。這些功能包括: 加解密引擎:SDP支持多種加密算法,如SM4分組密碼算法,用于對數(shù)據(jù)進(jìn)行加密和解密操作,確保數(shù)據(jù)安全性和機(jī)密性。
    發(fā)表于 12-19 00:36

    龍芯3A6000性能實(shí)測:媲美10代酷睿i3、同頻超越14代酷睿i5

    )和256位高級向量處理擴(kuò)展指令(LASX),支持同時多線程技術(shù)(SMT2)。集成雙通道DDR4-3200控制器,集成安全可信模塊,可提供安全啟動方案和國密(SM2、
    發(fā)表于 11-29 10:44

    如何用BurnTool給思的星芯片BS25燒寫程序?

    本文介紹用BurnTool給思的星芯片BS25燒寫程序。
    的頭像 發(fā)表于 11-14 09:08 ?3196次閱讀
    如何用BurnTool給<b class='flag-5'>海</b>思的星<b class='flag-5'>閃</b>芯片BS25燒寫程序?

    石墨烯之父——安德烈·姆,好奇驅(qū)使下的幽默大師和創(chuàng)新者

    安德烈·姆教授是卓越科學(xué)家,被譽(yù)為“石墨烯之父”,獲諾貝爾物理學(xué)獎,對石墨烯材料有重大貢獻(xiàn)。他重視好奇,鼓勵將好奇集中在研究領(lǐng)域。他認(rèn)為石墨烯是一種非常年輕的材料,未來有著無限的可能性,可以應(yīng)用于電池、光照材料、冷卻LED
    的頭像 發(fā)表于 10-31 21:36 ?696次閱讀
    石墨烯之父——安德烈·<b class='flag-5'>海</b>姆,好奇<b class='flag-5'>心</b>驅(qū)使下的幽默大師和創(chuàng)新者

    如何選擇和編譯思星BS25 SDK下的sle mouse工程

    本文介紹如何選擇和編譯思星BS25 SDK下的sle mouse工程。本文假設(shè)開發(fā)環(huán)境已經(jīng)搭建完畢,具體搭建流程請參考《遙遙領(lǐng)先,華為思星芯片BS25開發(fā)環(huán)境搭建》。
    的頭像 發(fā)表于 10-27 11:23 ?4242次閱讀
    如何選擇和編譯<b class='flag-5'>海</b>思星<b class='flag-5'>閃</b>BS25 SDK下的sle mouse工程

    安全等級密碼模塊設(shè)計架構(gòu)解決方案

    在算法層面,由于對稱密碼算法 SM4 沒有基于密鑰的分支運(yùn)算,因此對稱算法對計時攻擊天然免疫,故無須針對上述算法做專門的計時攻擊防護(hù)設(shè)計。
    發(fā)表于 10-17 12:16 ?919次閱讀
    高<b class='flag-5'>安全</b>等級密碼模塊設(shè)計架構(gòu)解決方案

    產(chǎn)品榮譽(yù) | 2023 Innovators Awards金獎-伯森3D測傳感器

    9月22日,由VisionSystemsDesign舉辦的2023InnovatorsAwards在上海圓滿舉辦,伯森3D測傳感器成功斬獲創(chuàng)新產(chǎn)品金獎?;顒蝇F(xiàn)場伯森技術(shù)(深圳)有限公司區(qū)域銷售
    的頭像 發(fā)表于 09-27 17:30 ?858次閱讀
    產(chǎn)品榮譽(yù) | 2023 Innovators Awards金獎-<b class='flag-5'>海</b>伯森3D<b class='flag-5'>閃</b>測傳感器

    鴻海印度手機(jī)生產(chǎn)線已達(dá)50條,每秒可制造3~4部手機(jī)

    據(jù)美國投資機(jī)構(gòu)稱,鴻在印度生產(chǎn)基地每秒生產(chǎn)3至4部手機(jī),旺季每月生產(chǎn)450萬部,其中大部分是android智能手機(jī)。鴻工廠每年生產(chǎn)約1000萬臺功能機(jī)器。
    的頭像 發(fā)表于 09-27 09:43 ?451次閱讀

    伯森3D測傳感器斬獲創(chuàng)新產(chǎn)品金獎

    伯森3D測傳感器HPS-DBL60于2022年4月在國內(nèi)首發(fā),是一款工業(yè)級2D/3D復(fù)合光學(xué)精密測量傳感器,賦能國產(chǎn)智能制造業(yè)的高速發(fā)展。
    的頭像 發(fā)表于 09-26 14:15 ?711次閱讀