0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPU如何突破算力供需瓶頸

沐曦MetaX ? 來源:沐曦MetaX ? 2023-08-22 10:26 ? 次閱讀

近日,2023中國算力大會(huì)在寧夏銀川舉行,沐曦集成電路(上海)有限公司(下稱“沐曦”)聯(lián)合創(chuàng)始人、CTO兼首席硬件架構(gòu)師彭莉受邀出席由中國信息通信研究院、中國互聯(lián)網(wǎng)協(xié)會(huì)聯(lián)合舉辦的智能計(jì)算論壇,并擔(dān)任演講嘉賓,探討后GPT時(shí)代算力需求激增帶來的挑戰(zhàn)以及GPU如何突破算力供需瓶頸、推動(dòng)人工智能產(chǎn)業(yè)普惠化發(fā)展。

沐曦聯(lián)合創(chuàng)始人、CTO兼首席硬件架構(gòu)師彭莉

發(fā)表主題演講

在題為“后GPT時(shí)代的算力需求”的演講中,彭莉預(yù)測(cè)大模型商業(yè)模式將分為通用計(jì)算市場(chǎng)和專用定制化市場(chǎng)兩大類:在通用計(jì)算市場(chǎng),大語言模型將終結(jié)多數(shù)NLP任務(wù),NLP技術(shù)水平被強(qiáng)行拉平,通用大模型或被大廠“壟斷”;而在專用定制化市場(chǎng),開源大模型將呈現(xiàn)百花齊放的發(fā)展態(tài)勢(shì),可針對(duì)私有數(shù)據(jù)、敏感數(shù)據(jù)進(jìn)行快速定制和領(lǐng)域?qū)R,大模型開發(fā)和部署能力將趨于普及化。

彭莉指出,區(qū)別于傳統(tǒng)AI,生成式AI技術(shù)可以借助接入類ChatGPT應(yīng)用發(fā)揮顯著的技術(shù)優(yōu)勢(shì),為大語言模型的開發(fā)降本增效,同時(shí)也對(duì)算力提出更高和更迫切的要求。由于大模型訓(xùn)練的一次性成本被大規(guī)模推理攤薄,大模型盈利的一大難點(diǎn)是降低推理成本。沐曦致力于打造高效通用的GPU芯片及軟硬件一體的生態(tài)解決方案,通過GPU軟件生態(tài)優(yōu)勢(shì)、硬件架構(gòu)優(yōu)勢(shì)、先進(jìn)封裝等方面全面提升GPU算力,降低大模型訓(xùn)練和推理的算力成本,在產(chǎn)品路線和生態(tài)戰(zhàn)略上均可滿足大模型對(duì)算力基礎(chǔ)設(shè)施的大規(guī)模需求,為推進(jìn)智能產(chǎn)業(yè)可持續(xù)發(fā)展打造堅(jiān)實(shí)的算力底座。

審核編輯:彭菁

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 集成電路
    +關(guān)注

    關(guān)注

    5366

    文章

    11162

    瀏覽量

    358363
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4591

    瀏覽量

    128141
  • 硬件
    +關(guān)注

    關(guān)注

    11

    文章

    3112

    瀏覽量

    65846
  • 沐曦
    +關(guān)注

    關(guān)注

    0

    文章

    26

    瀏覽量

    1127
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2135

    瀏覽量

    1978
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    【書籍評(píng)測(cè)活動(dòng)NO.43】 芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

    的高質(zhì)量和專業(yè)網(wǎng)絡(luò)媒體的信息更新速度。 芯片在最近15年有著巨大性能突破,這些年Intel的CPU芯片從雙核128位SIMD到眾核512位SIMD;NVIDIA的GPU產(chǎn)品從第一次
    發(fā)表于 09-02 10:09

    服務(wù)器為什么選擇GPU

    隨著人工智能技術(shù)的快速普及,需求日益增長(zhǎng)。智中心的服務(wù)器作為支撐大規(guī)模數(shù)據(jù)處理和計(jì)算的核心設(shè)備,其性能優(yōu)化顯得尤為關(guān)鍵。而GPU服務(wù)器也進(jìn)入了大眾的視野,成為高性能計(jì)算的首選。那
    的頭像 發(fā)表于 07-25 08:28 ?275次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>服務(wù)器為什么選擇<b class='flag-5'>GPU</b>

    IaaS+on+DPU(IoD)+下一代高性能底座技術(shù)白皮書

    DPU 是當(dāng)下基礎(chǔ)設(shè)施的核心創(chuàng)新之一。如果把 CPU 比做大腦,那么 GPU 就好比是肌肉,而 DPU 就是神經(jīng)中樞。CPU 承載了應(yīng)用生態(tài),提供了通用型
    發(fā)表于 07-24 15:32

    力系列基礎(chǔ)篇——101:從零開始了解

    相信大家已經(jīng)感受到,我們正處在一個(gè)人工智能時(shí)代。如果要問在人工智能時(shí)代最重要的是什么?那必須是:!!
    的頭像 發(fā)表于 04-24 08:05 ?1002次閱讀
    <b class='flag-5'>算</b>力系列基礎(chǔ)篇——<b class='flag-5'>算</b><b class='flag-5'>力</b>101:從零開始了解<b class='flag-5'>算</b><b class='flag-5'>力</b>

    AIGC掀需求革命,邊緣計(jì)算將不再“邊緣”

    AI瓶頸下邊緣計(jì)算崛起
    的頭像 發(fā)表于 04-22 14:51 ?240次閱讀

    液冷是大模型對(duì)需求的必然選擇?|英偉達(dá) GTC 2024六大亮點(diǎn)

    在這個(gè)以高性能計(jì)算和大模型推動(dòng)未來通用人工智能時(shí)代,已成為科技發(fā)展的隱形支柱。本文將重點(diǎn)探討的演進(jìn),深入分析在不同領(lǐng)域中
    的頭像 發(fā)表于 04-10 12:57 ?344次閱讀
    液冷是大模型對(duì)<b class='flag-5'>算</b><b class='flag-5'>力</b>需求的必然選擇?|英偉達(dá) GTC 2024六大亮點(diǎn)

    Sora需求引發(fā)業(yè)界對(duì)集結(jié)國內(nèi)AI企業(yè)的探討

    據(jù)周鴻祎觀察,Sora視頻分析所需恐遠(yuǎn)超千億規(guī)模模型。因而,考慮到如今國內(nèi)芯片供應(yīng)受限,問題至關(guān)重要。事實(shí)上,Meta已有約50萬臺(tái) GPU
    的頭像 發(fā)表于 02-25 10:03 ?449次閱讀

    智能規(guī)模超通用,大模型對(duì)智能提出高要求

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)是設(shè)備通過處理數(shù)據(jù),實(shí)現(xiàn)特定結(jié)果輸出的計(jì)算能力,常用FLOPS作為計(jì)量單位。FLOPS是Floating-point Operations Per Second
    的頭像 發(fā)表于 02-06 00:08 ?5457次閱讀

    大茉莉X16-P,5800M大稱王稱霸

    Rykj365
    發(fā)布于 :2024年01月25日 14:54:52

    深入了解浮點(diǎn)運(yùn)算—CPU和GPU是如何計(jì)算的?

    隨著國家大力發(fā)展數(shù)字經(jīng)濟(jì),的提升和普惠變得越來越重要。在數(shù)字化時(shí)代,已成為推動(dòng)科技發(fā)展和創(chuàng)新的關(guān)鍵要素。
    的頭像 發(fā)表于 01-18 18:20 ?3165次閱讀
    深入了解浮點(diǎn)運(yùn)算—CPU和<b class='flag-5'>GPU</b><b class='flag-5'>算</b><b class='flag-5'>力</b>是如何計(jì)算的?

    GPU是顯卡嗎 cpu和gpu哪個(gè)強(qiáng)

    很大的區(qū)別,因此它們的計(jì)算能力也不同。 首先,我們來看一下CPU(中央處理器)的。CPU是一種通用處理器,它被設(shè)計(jì)用于處理各種不同類型的任務(wù),包括數(shù)據(jù)處理、指令執(zhí)行、邏輯控制等。CPU的核心數(shù)量和頻率是衡量其
    的頭像 發(fā)表于 01-10 15:45 ?4446次閱讀

    弘信電子與AI服務(wù)器合資,助力國產(chǎn)芯片落地

    此外,弘信電子近期在AI業(yè)務(wù)上取得了突破性進(jìn)展,這并非源自本土化的積累,而是依賴于團(tuán)隊(duì)敏銳的戰(zhàn)略眼光和強(qiáng)烈的創(chuàng)新動(dòng)力。此次投資是弘信電子在AI
    的頭像 發(fā)表于 12-25 09:30 ?645次閱讀

    探索AIGC未來:CPU源碼優(yōu)化、多GPU編程與中國瓶頸與發(fā)展

    ,大大提高人工智能模型的計(jì)算能力,更好地滿足實(shí)際應(yīng)用的需求。 本文將分析AIGC的最新進(jìn)展,深入探討以上話題,以及中國產(chǎn)業(yè)的瓶頸和趨勢(shì)。
    的頭像 發(fā)表于 12-08 11:49 ?1340次閱讀
    探索AIGC未來:CPU源碼優(yōu)化、多<b class='flag-5'>GPU</b>編程與中國<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>瓶頸</b>與發(fā)展

    到底什么是?的作用?

    的字面意思,大家都懂,就是計(jì)算能力(Computing Power)。
    的頭像 發(fā)表于 11-20 09:26 ?1571次閱讀
    到底什么是<b class='flag-5'>算</b><b class='flag-5'>力</b>?<b class='flag-5'>算</b><b class='flag-5'>力</b>的作用?

    人工智能為什么需要GPU?

    GPU前面加一個(gè)“GP”,就變?yōu)镚eneral-Purpose Computing on Graphics Processing Units,即通用計(jì)算圖形處理器。我們?nèi)バg(shù)語化,可以直接說這是一種用于處理非特定需求(通用類型)計(jì)算目的的
    發(fā)表于 11-10 14:48 ?5413次閱讀
    人工智能<b class='flag-5'>算</b><b class='flag-5'>力</b>為什么需要<b class='flag-5'>GPU</b>?