0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

稀疏化計算產品商業(yè)落地將賦能AI產業(yè)變革

lPCU_elecfans ? 來源:電子發(fā)燒友網(wǎng) ? 作者:電子發(fā)燒友網(wǎng) ? 2022-09-02 09:45 ? 次閱讀

電子發(fā)燒友網(wǎng)報道(文/李彎彎)AI5G等新興產業(yè)的蓬勃發(fā)展催生了海量數(shù)據(jù)計算需求,同時AI算法模型持續(xù)迭代,復雜化日益凸顯,數(shù)字經濟時代下市場需要強大、普惠的算力引擎。而從供給端來看,先進制程的迭代周期變長,使得芯片能效比的提升并不顯著。

針對AI應用特點實現(xiàn)硬件架構創(chuàng)新是必然趨勢,墨芯人工智能CEO王維在某論壇上談到,依托對AI的理解用軟硬一體解決算力瓶頸問題是行業(yè)公認的發(fā)展方向。他認為,稀疏化能夠有效應對算力瓶頸,實現(xiàn)原理是,不存儲和不處理零值,從而得到更小且更快的模型。

軟硬一體化稀疏路徑符合AI計算核心訴求軟硬一體化稀疏路徑符合AI計算高吞吐、低功耗、低延時的核心需求。AI稀疏產業(yè)化的成功要素包括:1、跨算法、軟件、硬件領域的協(xié)同開發(fā);2、擁有持續(xù)多層次優(yōu)化稀疏運算的底層算法能力;3、架構需保證可編程性、高度可拓展屬性及快速迭代能力。

稀疏化路徑已具備批量化工程應用能力。英偉達在2020年推出的A100產品中,就率先引入稀疏Tensor Core實現(xiàn)4:2結構化稀疏,稀疏是神經網(wǎng)絡輕量化的重要手段,英偉達稀疏化產品有效引領市場應用趨勢。稀疏化架構可與現(xiàn)有AI軟件生態(tài)深度適配,例如英偉達直接使用Tensor Core進行稀疏矩陣乘累加操作,無需進行底層編程。

基于雙稀疏特點,自研核心AI架構墨芯是全球最早研發(fā)稀疏化算法及架構的企業(yè),并在2018年開始稀疏化的全球專利布局,該公司也是最早商用稀疏化產品實現(xiàn)銷售的,第一款FPGA產品在2019年Q4開始產生銷售。

王維表示,現(xiàn)有芯片架構設計在稀疏化支持中面臨較大局限,比如CPU架構,可支持跳點運算,但因其算力限制,僅能夠支持邊緣端應用,無法支持更大的模型,再比如GPU架構,只能進行并行計算,所有元素(包括0元素)均參與運算,無法實現(xiàn)高倍數(shù)加速。

基于雙稀疏特點,墨芯自研核心AI架構。其雙稀疏架構設計理念:平衡的權重和激活張量剪枝技術,可將精度損失降至最低的前提下保持對硬件的友好度;墨芯獨有的剪枝和壓縮技術可以再許多網(wǎng)絡和應用中實現(xiàn)最多高到32倍的稀疏。

墨芯首款稀疏化云端AI芯片Antoum-1已經回片,實測性能ResNet 50超33000SPS;墨芯板卡S4(單顆Antoum-1)僅30W功耗,實測性能實現(xiàn)英偉達主流產品T4近16倍能效比;墨芯板卡S4對比英偉達主流產品Latency可以做到1/4-1/5。

稀疏化計算產品商業(yè)落地,將賦能AI產業(yè)變革。一、助力云服務商降低單位算力擁有成本,2021年,Nvidia在中國營收超過38億美金,其中阿里,騰訊等頭部互聯(lián)網(wǎng)公司采購金額基本超過1億美金。隨著AI持續(xù)發(fā)展,數(shù)據(jù)量的指數(shù)上升導致AI芯片的需求會持續(xù)上升,云服務商采購額將逐年增加,因此他們對降低成本的訴求非常強勁,基于Antoum-1的推理卡S4相較于英偉達對標推理卡T4,ResNest50及BERT每FPS/SPS成本降低約85%。

二、助力云服務商縮減能耗成本,電費支出是數(shù)據(jù)中心最大的營業(yè)成本,平均數(shù)據(jù)中心近60%的營業(yè)成本是電力成本,降低能耗是數(shù)據(jù)中心和云服務商的最大痛點,2021年全國數(shù)據(jù)中心的耗電量占社會總用電的近3%,且增長率已連續(xù)8年超過12%,基于Antoum-1的推理卡S4相較于Nvidia主力推理卡T4,ResNest50及BERT每FPS/SPS能耗成本降低約90%。

小結目前基于稀疏化的AI架構主要面向云端訓練場景,不過理論上來說,稀疏化訓練由于能大幅降低對內存、帶寬與計算的需求,十分適合訓練,未來墨芯在滿足推理市場的需求后,將切入訓練市場,建立稀疏訓練生態(tài),產品在軟件層面對訓練做更多的開發(fā),支持訓練專用的算子,同時硬件上也會為訓練定義架構。

審核編輯:彭靜
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 硬件
    +關注

    關注

    11

    文章

    3217

    瀏覽量

    66066
  • AI
    AI
    +關注

    關注

    87

    文章

    29822

    瀏覽量

    268111
  • 人工智能
    +關注

    關注

    1789

    文章

    46669

    瀏覽量

    237104

原文標題:?稀疏化應對算力瓶頸,助力云服務商大幅降低成本

文章出處:【微信號:elecfans,微信公眾號:電子發(fā)燒友網(wǎng)】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    【書籍評測活動NO.49】大模型啟示錄:一本AI應用百科全書

    、使用Copilot等提高員工效率。 但更多的行業(yè)雖然有充分的落地積極性,卻很難看清我們現(xiàn)在擁抱的“大模型”在企業(yè)工作流程中應該長成啥樣。在行業(yè)早期,因為缺乏標準產品,最先落地的也往
    發(fā)表于 10-28 15:34

    華為云徐峰:AI 應用現(xiàn)代,加速軟件生產力躍升

    ,分享了智能應用的行業(yè)實踐,并發(fā)布了華為云在應用開發(fā)、運行、運維、集成領域的智能產品能力。 在主題為“ AI
    的頭像 發(fā)表于 10-14 09:45 ?438次閱讀
    華為云徐峰:<b class='flag-5'>AI</b> <b class='flag-5'>賦</b><b class='flag-5'>能</b>應用現(xiàn)代<b class='flag-5'>化</b>,加速軟件生產力躍升

    RISC-V Summit China 2024 | 青稞RISC-V+接口PHY,RISC-V高效落地

    方式,從同質的市場環(huán)境中脫穎而出,通過專業(yè)接口技術RISC-V導入下游廣闊的互聯(lián)互通場景,為萬物互聯(lián)的世界。 03 青稞內核+接口PHY,讓RISC-V高效
    發(fā)表于 08-30 17:37

    聚焦AI技術引領,智象未來全面圖片及視頻內容生產

    當前,AIGC浪潮不斷席卷各行各業(yè),隨著其技術的不斷釋放,全新行業(yè)價值正在顯現(xiàn),AI技術也在從產業(yè)化應用向社會應用轉變,深刻影響著產品創(chuàng)新、內容創(chuàng)作及
    的頭像 發(fā)表于 06-24 13:36 ?267次閱讀
    聚焦<b class='flag-5'>AI</b>技術引領,智象未來全面<b class='flag-5'>賦</b><b class='flag-5'>能</b>圖片及視頻內容生產

    數(shù)字EDARISC-V落地演進技術研討會成功舉辦

    為了推動RISC-V技術的落地與演進, 國家集成電路設計深圳產業(yè)化基地攜手思爾芯 ,于2024年6月18日下午成功舉辦了“數(shù)字EDARISC-V
    的頭像 發(fā)表于 06-20 11:15 ?663次閱讀

    AI引爆邊緣計算變革,塑造嵌入式產業(yè)新未來AI引爆邊緣計算變革,塑造嵌入式產業(yè)新未來——2024研華嵌入式

    中國北京,2024年5月30日?- 2024年研華嵌入式產業(yè)合作伙伴會議在北京·中關村皇冠假日酒店成功舉辦,現(xiàn)場參會嘉賓逾300人。會議以“AI引爆邊緣計算變革,塑造嵌入式
    發(fā)表于 05-31 13:53 ?257次閱讀
    <b class='flag-5'>AI</b>引爆邊緣<b class='flag-5'>計算</b><b class='flag-5'>變革</b>,塑造嵌入式<b class='flag-5'>產業(yè)</b>新未來<b class='flag-5'>AI</b>引爆邊緣<b class='flag-5'>計算</b><b class='flag-5'>變革</b>,塑造嵌入式<b class='flag-5'>產業(yè)</b>新未來——2024研華嵌入式

    中科創(chuàng)達全球首發(fā)面向中央計算AI原生整車操作系統(tǒng)—滴水OS

    2024年4月26日,作為全球領先的智能操作系統(tǒng)及端側智能產品和技術提供商,中科創(chuàng)達在北京國際車展上全球首發(fā)面向中央計算AI原生整車操作系統(tǒng)——滴水OS,旨在
    的頭像 發(fā)表于 04-28 09:58 ?850次閱讀

    文遠知行與聯(lián)想車計算戰(zhàn)略合作,推進自動駕駛商業(yè)化落地

    文遠知行與聯(lián)想車計算達成戰(zhàn)略合作,共同推進L4級別自動駕駛解決方案的商業(yè)化落地,這一舉措無疑為自動駕駛領域注入了新的活力。這次合作不僅彰顯了雙方在自動駕駛技術方面的深厚積累,也預示著自動駕駛技術
    的頭像 發(fā)表于 03-20 10:19 ?449次閱讀

    AI+工業(yè)互聯(lián)網(wǎng)”新型工業(yè)的路徑分析

    橫看成嶺側成峰,探索“AI+工業(yè)互聯(lián)網(wǎng)”技術新型工業(yè)的路徑,還要從技術視角、產業(yè)視角、應用視角綜合分析。
    的頭像 發(fā)表于 03-14 10:57 ?1047次閱讀

    國資委重磅部署!央企引領 AI 產業(yè)煥新

    2月19日,國務院國資委召開“AI 產業(yè)煥新”中央企業(yè)人工智能專題推進會。
    的頭像 發(fā)表于 02-29 17:41 ?678次閱讀
    國資委重磅部署!央企引領 <b class='flag-5'>AI</b><b class='flag-5'>賦</b><b class='flag-5'>能</b> <b class='flag-5'>產業(yè)</b>煥新

    高通持續(xù)推動終端側生成式AI變革,推出高通AI Hub能開發(fā)者

    高通現(xiàn)終端側AI在下一代PC、智能手機、軟件定義汽車、XR設備和物聯(lián)網(wǎng)等領域規(guī)模商用,讓智能計算無處不在。
    的頭像 發(fā)表于 02-26 16:46 ?579次閱讀

    華秋榮獲億邦動力2023產業(yè)互聯(lián)網(wǎng)千峰獎,引領電子產業(yè)數(shù)字變革

    專業(yè)投資者對華秋未來發(fā)展前景的持續(xù)看好。 華秋自2011年成立以來,一直致力于為電子產業(yè)提供高效、高可靠和高性價比的數(shù)字服務。公司以數(shù)字
    發(fā)表于 12-15 09:57

    持續(xù)科技,引領電子產業(yè)鏈新范式!華秋喜獲“2023深圳行業(yè)領袖企業(yè)100強”稱號

    的方向發(fā)展。 二:智能方向:數(shù)字智能制造 在智能制造方面,華秋基于一站式數(shù)字電子供應鏈能力,以工業(yè)軟件
    發(fā)表于 12-08 09:55

    華秋榮獲2023中國產業(yè)數(shù)字百強榜企業(yè)

    持不懈努力的認可。 這也是自2021年以來,華秋連續(xù)3年獲得此殊榮。 華秋始終堅持以幫助客戶增效本為使命,以信息技術驅動業(yè)務創(chuàng)新,以數(shù)字技術
    發(fā)表于 12-04 10:01

    上海站報名啟動! 2023年開源產業(yè)生態(tài)大會OpenHarmony生態(tài)分論壇

    終端操作系統(tǒng)根社區(qū)和萬物互聯(lián)的底座。 OpenHarmony生態(tài)分論壇旨在倡議更多生態(tài)伙伴加入OpenHarmony社區(qū),攜手伙伴產業(yè)升級,助力萬物互聯(lián)的大業(yè)和千行百業(yè)的數(shù)字轉型
    發(fā)表于 11-24 14:55