0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大模型時(shí)代,國(guó)產(chǎn)GPU面臨哪些挑戰(zhàn)

Carol Li ? 來(lái)源:電子發(fā)燒友 ? 作者:李彎彎 ? 2024-04-03 01:08 ? 次閱讀

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)隨著人工智能技術(shù)的快速發(fā)展,對(duì)GPU計(jì)算能力的需求也越來(lái)越高。國(guó)內(nèi)企業(yè)也正在不斷提升GPU性能,以滿足日益增長(zhǎng)的應(yīng)用需求。然而,相較于國(guó)際巨頭,國(guó)內(nèi)GPU仍然存在差距,國(guó)產(chǎn)GPU在不斷成長(zhǎng)的過(guò)程中也存在諸多挑戰(zhàn)。

在大模型訓(xùn)練上存在差距

大語(yǔ)言模型是基于深度學(xué)習(xí)的技術(shù)。這些模型通過(guò)在海量文本數(shù)據(jù)上的訓(xùn)練,學(xué)習(xí)語(yǔ)言的語(yǔ)法、語(yǔ)境和語(yǔ)義等多層次的信息,用于理解和生成自然語(yǔ)言文本。大語(yǔ)言模型是自然語(yǔ)言處理(NLP)領(lǐng)域中的一個(gè)重要分支,應(yīng)用于文本生成、分類、情感分析等多種任務(wù)。

深度學(xué)習(xí)是現(xiàn)代機(jī)器學(xué)習(xí)領(lǐng)域的一種強(qiáng)大的算法,它可以在圖像識(shí)別、語(yǔ)音識(shí)別、自然語(yǔ)言處理、游戲AI等各種應(yīng)用領(lǐng)域取得驚人的成果。然而,深度學(xué)習(xí)對(duì)計(jì)算幾硬件的要求非常高,通常需要使用GPU進(jìn)行大規(guī)模訓(xùn)練。在使用GPU進(jìn)行深度學(xué)習(xí)時(shí),一個(gè)常見的問(wèn)題就是選擇單精度還是雙精度。

浮點(diǎn)數(shù)是一種用于表示實(shí)數(shù)的數(shù)值格式,它包括符號(hào)位、指數(shù)位和尾數(shù)位三部分。通過(guò)這三部分,浮點(diǎn)數(shù)可以表示非常大或非常小的數(shù),同時(shí)保持一定的精度。

單精度和雙精度是指浮點(diǎn)數(shù)在計(jì)算機(jī)中的存儲(chǔ)方式和精度。單精度通常使用32位(4字節(jié))來(lái)存儲(chǔ)一個(gè)浮點(diǎn)數(shù),而雙精度則使用64位(8字節(jié))來(lái)存儲(chǔ)。由于雙精度使用了更多的位數(shù),因此它可以表示更大范圍的數(shù)值,并具有更高的精度。

大模型訓(xùn)練需要處理高顆粒度的信息,因此對(duì)于用于大模型訓(xùn)練的GPU芯片處理信息的精細(xì)度和算力速度要求更高,現(xiàn)階段,國(guó)產(chǎn)GPU在支持大模型訓(xùn)練的能力方面相對(duì)來(lái)說(shuō)還較差。

不同于多媒體和圖形處理的單精度浮點(diǎn)計(jì)算(FP32)計(jì)算需求,雙精度浮點(diǎn)計(jì)算能力FP64是進(jìn)行高算力計(jì)算的硬性指標(biāo)。英偉達(dá)的A100同時(shí)具備上述兩類能力,而國(guó)內(nèi)大多GPU只能處理單精度浮點(diǎn)計(jì)算。

從目前的信息來(lái)看,海光信息的協(xié)處理器DCU)能夠支持FP64雙精度浮點(diǎn)運(yùn)算,海光DCU屬于GPGPU 的一種,采用“類CUDA”通用并行計(jì)算架構(gòu)。據(jù)該公司介紹,其DCU產(chǎn)品能夠完整支持大模型訓(xùn)練。不過(guò)相比于英偉達(dá)的A100性能只有其60%。

另外,景嘉微表示面向AI 訓(xùn)練、AI推理、科學(xué)計(jì)算等應(yīng)用領(lǐng)域研發(fā)成功的景宏系列,支持INT8、FP16、FP32、FP64等混合精度運(yùn)算,該產(chǎn)品在大模型的訓(xùn)練上或許也可以期待一下。

在軟件和生態(tài)方面存在差距

除上述情況以外,國(guó)產(chǎn)GPU在軟件和生態(tài)方面與全球領(lǐng)先品牌相比,也存在一定的差距。軟件工具鏈的完善度方面,全球領(lǐng)先的GPU廠商已經(jīng)構(gòu)建了完整的軟件工具鏈,包括編譯器、調(diào)試器、性能分析工具等,可以方便地支持開發(fā)人員進(jìn)行GPU程序的開發(fā)、調(diào)試和優(yōu)化。而國(guó)產(chǎn)GPU在這方面還需要進(jìn)一步完善,以滿足用戶的多樣化需求。

生態(tài)系統(tǒng)的成熟度方面,全球GPU市場(chǎng)已經(jīng)形成了較為成熟的生態(tài)系統(tǒng),涵蓋了各種應(yīng)用領(lǐng)域和場(chǎng)景。然而,國(guó)產(chǎn)GPU在生態(tài)系統(tǒng)建設(shè)方面尚處于起步階段,缺乏足夠的應(yīng)用支持和市場(chǎng)認(rèn)可。這導(dǎo)致國(guó)產(chǎn)GPU在市場(chǎng)上的競(jìng)爭(zhēng)力相對(duì)較弱,難以與全球領(lǐng)先品牌抗衡。

近些年可以明顯的看到,國(guó)產(chǎn)PGU企業(yè)也正在這些方面不斷努力。在軟件支持方面,國(guó)產(chǎn)GPU企業(yè)正在積極與主流操作系統(tǒng)、開發(fā)環(huán)境以及圖形處理軟件等進(jìn)行適配,確保用戶能夠流暢地使用各種應(yīng)用軟件。同時(shí),一些企業(yè)還在推動(dòng)GPU在人工智能、云計(jì)算等新興領(lǐng)域的應(yīng)用,為國(guó)產(chǎn)GPU生態(tài)注入新的活力。

在驅(qū)動(dòng)程序優(yōu)化方面,國(guó)產(chǎn)GPU企業(yè)也在加大投入力度,不斷提升驅(qū)動(dòng)程序的性能和穩(wěn)定性。通過(guò)優(yōu)化驅(qū)動(dòng)程序,可以充分發(fā)揮GPU的性能優(yōu)勢(shì),提升整體計(jì)算效率。

此外,國(guó)產(chǎn)GPU企業(yè)還在積極探索與各種應(yīng)用場(chǎng)景的深度融合。例如,在游戲、圖形設(shè)計(jì)、視頻渲染等領(lǐng)域,國(guó)產(chǎn)GPU正在與相關(guān)企業(yè)合作,共同推動(dòng)相關(guān)應(yīng)用的發(fā)展。這種深度融合不僅有助于提升國(guó)產(chǎn)GPU的市場(chǎng)競(jìng)爭(zhēng)力,也有助于推動(dòng)整個(gè)產(chǎn)業(yè)的進(jìn)步。

寫在最后

近些年國(guó)產(chǎn)GPU正在蓬勃發(fā)展,不過(guò)相較于國(guó)際巨頭,仍然存在較大差距。近年來(lái),大模型快速發(fā)展,國(guó)產(chǎn)GPU在大模型訓(xùn)練方面的不足也凸顯出來(lái)。不過(guò)也可以看到,目前國(guó)產(chǎn)GPU企業(yè)都在積極朝大模型方向布局,包括訓(xùn)練和推理。另外軟件和生態(tài)建設(shè)也在加速推進(jìn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4590

    瀏覽量

    128133
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2134

    瀏覽量

    1970
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    模型時(shí)代的算力需求

    現(xiàn)在AI已進(jìn)入大模型時(shí)代,各企業(yè)都爭(zhēng)相部署大模型,但如何保證大模型的算力,以及相關(guān)的穩(wěn)定性和性能,是一個(gè)極為重要的問(wèn)題,帶著這個(gè)極為重要的問(wèn)題,我需要在此書中找到答案。
    發(fā)表于 08-20 09:04

    【書籍評(píng)測(cè)活動(dòng)NO.41】大模型時(shí)代的基礎(chǔ)架構(gòu):大模型算力中心建設(shè)指南

    。 全書總計(jì)13章。第1章講解AI與大模型時(shí)代對(duì)基礎(chǔ)架構(gòu)的需求;第2章講解軟件程序與專用硬件的結(jié)合,涉及GPU并行運(yùn)算庫(kù)、機(jī)器學(xué)習(xí)程序的開發(fā)框架和分布式AI訓(xùn)練;第3章剖析GPU的硬
    發(fā)表于 08-16 18:33

    國(guó)產(chǎn)FPGA的發(fā)展前景是什么?

    ,擴(kuò)大市場(chǎng)份額。 國(guó)際化布局:加強(qiáng)與國(guó)際巨頭的合作與競(jìng)爭(zhēng),了解國(guó)際市場(chǎng)需求和趨勢(shì),推動(dòng)國(guó)產(chǎn)FPGA走向全球。 六、面臨挑戰(zhàn)盡管國(guó)產(chǎn)FPGA的發(fā)展前景廣闊,但仍
    發(fā)表于 07-29 17:04

    模型發(fā)展下,國(guó)產(chǎn)GPU的機(jī)會(huì)和挑戰(zhàn)

    電子發(fā)燒友網(wǎng)站提供《大模型發(fā)展下,國(guó)產(chǎn)GPU的機(jī)會(huì)和挑戰(zhàn).pdf》資料免費(fèi)下載
    發(fā)表于 07-18 15:44 ?6次下載
    大<b class='flag-5'>模型</b>發(fā)展下,<b class='flag-5'>國(guó)產(chǎn)</b><b class='flag-5'>GPU</b>的機(jī)會(huì)和<b class='flag-5'>挑戰(zhàn)</b>

    模型發(fā)展下,國(guó)產(chǎn)GPU的機(jī)會(huì)和挑戰(zhàn)(下)

    洞見分析經(jīng)驗(yàn)分享模型
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2024年06月11日 17:15:23

    模型發(fā)展下,國(guó)產(chǎn)GPU的機(jī)會(huì)和挑戰(zhàn)(上)

    洞見分析經(jīng)驗(yàn)分享模型
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2024年06月11日 16:51:11

    摩爾線程與無(wú)問(wèn)芯穹在國(guó)產(chǎn)GPU上首次實(shí)現(xiàn)大模型實(shí)訓(xùn)

    近日,摩爾線程與無(wú)問(wèn)芯穹共同宣布,雙方已正式完成基于國(guó)產(chǎn)全功能GPU千卡集群的3B規(guī)模大模型實(shí)訓(xùn)。這款名為“MT-infini-3B”的模型,在摩爾線程夸娥(KUAE)千卡智算集群與無(wú)
    的頭像 發(fā)表于 05-27 10:59 ?547次閱讀

    2024年國(guó)產(chǎn)數(shù)字隔離器:挑戰(zhàn)與機(jī)遇探析

    國(guó)產(chǎn)數(shù)字隔離器作為一種重要的電子元器件,在工業(yè)控制、通信、醫(yī)療等領(lǐng)域發(fā)揮著重要作用。然而,面對(duì)不斷變化的市場(chǎng)環(huán)境和技術(shù)挑戰(zhàn),國(guó)產(chǎn)數(shù)字隔離器在2024年面臨著諸多
    的頭像 發(fā)表于 05-24 17:15 ?420次閱讀
    2024年<b class='flag-5'>國(guó)產(chǎn)</b>數(shù)字隔離器:<b class='flag-5'>挑戰(zhàn)</b>與機(jī)遇探析

    國(guó)產(chǎn)GPU在AI大模型領(lǐng)域的應(yīng)用案例一覽

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)近一年多時(shí)間,隨著大模型的發(fā)展,GPU在AI領(lǐng)域的重要性再次凸顯。雖然相比英偉達(dá)等國(guó)際大廠,國(guó)產(chǎn)GPU起步較晚、聲勢(shì)較小。不過(guò)近幾年,國(guó)內(nèi)不少
    的頭像 發(fā)表于 04-01 09:28 ?3429次閱讀
    <b class='flag-5'>國(guó)產(chǎn)</b><b class='flag-5'>GPU</b>在AI大<b class='flag-5'>模型</b>領(lǐng)域的應(yīng)用案例一覽

    盤點(diǎn)國(guó)產(chǎn)GPU在支持大模型應(yīng)用方面的進(jìn)展

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)目前談到GPU,大家首先想到的應(yīng)該就是英偉達(dá)了。近一年多時(shí)間來(lái),隨著大模型的發(fā)展,英偉達(dá)GPU的強(qiáng)大實(shí)力可謂無(wú)人不知。而相比之下,國(guó)產(chǎn)
    的頭像 發(fā)表于 03-29 00:27 ?5087次閱讀
    盤點(diǎn)<b class='flag-5'>國(guó)產(chǎn)</b><b class='flag-5'>GPU</b>在支持大<b class='flag-5'>模型</b>應(yīng)用方面的進(jìn)展

    FPGA在深度學(xué)習(xí)應(yīng)用中或?qū)⑷〈?b class='flag-5'>GPU

    現(xiàn)場(chǎng)可編程門陣列 (FPGA) 解決了 GPU 在運(yùn)行深度學(xué)習(xí)模型時(shí)面臨的許多問(wèn)題 在過(guò)去的十年里,人工智能的再一次興起使顯卡行業(yè)受益匪淺。英偉達(dá) (Nvidia) 和 AMD 等公司的股價(jià)也大幅
    發(fā)表于 03-21 15:19

    國(guó)產(chǎn)光耦2024:發(fā)展機(jī)遇與挑戰(zhàn)全面解析

    隨著科技的不斷進(jìn)步,國(guó)產(chǎn)光耦在2024年正面臨著前所未有的機(jī)遇與挑戰(zhàn)。本文將深入分析國(guó)產(chǎn)光耦行業(yè)的發(fā)展現(xiàn)狀,揭示其在技術(shù)創(chuàng)新、市場(chǎng)需求等方面的機(jī)遇和
    的頭像 發(fā)表于 02-18 14:13 ?748次閱讀
    <b class='flag-5'>國(guó)產(chǎn)</b>光耦2024:發(fā)展機(jī)遇與<b class='flag-5'>挑戰(zhàn)</b>全面解析

    揭秘GPU: 高端GPU架構(gòu)設(shè)計(jì)的挑戰(zhàn)

    在計(jì)算領(lǐng)域,GPU(圖形處理單元)一直是性能飛躍的代表。眾所周知,高端GPU的設(shè)計(jì)充滿了挑戰(zhàn)。GPU的架構(gòu)創(chuàng)新,為軟件承接大模型訓(xùn)練和推理場(chǎng)
    的頭像 發(fā)表于 12-21 08:28 ?734次閱讀
    揭秘<b class='flag-5'>GPU</b>: 高端<b class='flag-5'>GPU</b>架構(gòu)設(shè)計(jì)的<b class='flag-5'>挑戰(zhàn)</b>

    模型數(shù)據(jù)集:構(gòu)建、挑戰(zhàn)與未來(lái)趨勢(shì)

    隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展,大型預(yù)訓(xùn)練模型如GPT-4、BERT等在各個(gè)領(lǐng)域取得了顯著的成功。這些大模型背后的關(guān)鍵之一是龐大的數(shù)據(jù)集,為模型提供了豐富的知識(shí)和信息。本文將探討大模型數(shù)據(jù)
    的頭像 發(fā)表于 12-06 15:28 ?1223次閱讀

    #GPU顯卡 #中國(guó)制造? 中國(guó)GPU面臨至暗時(shí)刻嗎?

    半導(dǎo)體元器件gpu
    深圳市浮思特科技有限公司
    發(fā)布于 :2023年11月07日 14:43:15