0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大模型時代,國產(chǎn)AI芯片最新進(jìn)展!算力集群化是必然趨勢

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2023-07-11 09:05 ? 次閱讀

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)在剛過去的2023世界人工智能大會上,大模型可以說是其中的大亮點(diǎn)之一,華為盤古、商湯日日新、網(wǎng)易伏羲等30多款國產(chǎn)AI大模型集中亮相。與此同時,各類人工智能芯片公司、算力提供商也針對大模型展示了相應(yīng)的方案。

大模型時代,國產(chǎn)AI芯片進(jìn)展如何?

在這次大會上,瀚博半導(dǎo)體、燧原科技、登臨科技、天數(shù)智芯等紛紛展示了針對大模型的產(chǎn)品方案,呈現(xiàn)出國產(chǎn)AI芯片在大模型領(lǐng)域的進(jìn)展情況。

瀚博半導(dǎo)體成立于2018年12月,是一家自研GPU芯片及解決方案提供商。在此次大會上,瀚博發(fā)布了第二代GPU SG100,并推出南禺系列GPU加速卡VG1600、VG1800、VG14,以及LLM大模型AI加速卡VA1L、AIGC大模型一體機(jī)、VA12高性能生成式AI加速卡等6款新品。

據(jù)介紹,瀚博SG100芯片采用7nm先進(jìn)制程,具備業(yè)界領(lǐng)先的渲染性能,同時兼具低延時高吞吐的AI算力和強(qiáng)大的視頻處理能力。

值得關(guān)注的,針對大模型時代算力需求,瀚博本次首發(fā)了LLM大模型AI加速卡VA1L,具備200 TOPS INT8/72 TFLOPS FP16算力,并支持ChatGPT、LLaMA、Stable Diffusion等主流AIGC網(wǎng)絡(luò)模型。

與此同時,瀚博此次還推出了AIGC大模型一體機(jī),共使用8張LLM大模型AI加速卡VA1L,支持512GB顯存,進(jìn)而支持1750億參數(shù)的大模型。

另外,作為瀚博VA1和VA10的升級版,VA12是一塊通用AI加速卡,支持檢測、分類、分割、視頻增強(qiáng)、語義理解、BERT、Transfomer和視頻編解碼等應(yīng)用。

燧原科技在此次大會上發(fā)布了燧原曜圖文生圖MaaS平臺服務(wù)產(chǎn)品。該產(chǎn)品以燧原科技“邃思”系列芯片為算力支撐,由首都在線提供計(jì)算服務(wù),燧原曜圖MaaS平臺服務(wù)產(chǎn)品為用戶提供面向AIGC時代的高效易用、安全可靠、企業(yè)級的文生圖服務(wù)。

燧原科技表示,它具備開箱即用可用、所想即所見、創(chuàng)意無限的文本生成圖像能力,通過軟硬一體方案降低大規(guī)模AIGC應(yīng)用的工程難度與算力成本,開啟AIGC應(yīng)用規(guī)?;涞貢r代。

燧原科技創(chuàng)始人兼CEO趙立東在某論壇上提到,目前燧原已經(jīng)為大型科研機(jī)構(gòu)部署了千卡規(guī)模的AI訓(xùn)練算力集群,并成功落地;而且與騰訊合作,在OCR文字識別、智能交互、智能會議等方面,性能達(dá)到了業(yè)界同類產(chǎn)品兩倍以上,性價比上具有很高優(yōu)勢。此外,在智慧城市方面,燧原完成2022年成都高新區(qū)國產(chǎn)化AI視頻基礎(chǔ)設(shè)施平臺項(xiàng)目建設(shè)。

此次大會上,登臨科技展示了最新一代創(chuàng)新通用GPU產(chǎn)品Goldwasser II系列以及基于開源大語言模型可交互界面。據(jù)了解,Goldwasser II針對基于Transformer和生成式AI 大模型進(jìn)行專門優(yōu)化,在性能有大幅提升,已于2022年流片,目前已開始規(guī)?;慨a(chǎn)和商業(yè)客戶驗(yàn)證。據(jù)現(xiàn)有客戶測試結(jié)果,二代產(chǎn)品針對基于transformer類型的模型提供3-5倍的性能提升,大幅降低類ChatGPT及生成式AI應(yīng)用的硬件成本。

天數(shù)智芯在此次會上也展示了在大模型訓(xùn)練、推理所取得的顯著進(jìn)展,包括圖片識別/以圖搜圖、3D建模、大模型推理等。在大模型領(lǐng)域,天數(shù)智芯今年上半年,搭建了40P算力320張?zhí)燠?00加速卡算力集群,完成智源研究院70億參數(shù)大模型全量訓(xùn)練,

天垓100是天數(shù)智芯2018年研發(fā)的通用AI訓(xùn)練芯片,據(jù)天數(shù)智芯董事長蓋魯江介紹,目前天垓100這款產(chǎn)品還已經(jīng)成功跑通了清華智譜 AI 大模型ChatGLM,Meta研發(fā)的LLaMA模型。此外,天數(shù)智芯正在幫智源研究院跑650億參數(shù)的模型,預(yù)計(jì)10月份可以跑完。

針對于A800芯片在無許可證的情況下將被禁售的話題,蓋魯江談到,事實(shí)上,不管英偉達(dá)的產(chǎn)品能不能賣給中國,我們的產(chǎn)品已經(jīng)能夠用起來了。

算力集群化是發(fā)展趨勢

伴隨大模型帶來的生成式AI突破,人工智能正在進(jìn)入一個新的時代。算力是人工智能產(chǎn)業(yè)創(chuàng)新的基礎(chǔ),大模型的持續(xù)創(chuàng)新,驅(qū)動算力需求的爆炸式增長。可以說,大模型訓(xùn)練的效率或者是創(chuàng)新的速度,根本上取決于算力的大小。

然而,中國的算力已經(jīng)成為一個越來越稀缺的資源。華為輪值董事長胡厚崑在某論壇上談到,大模型的研發(fā)高度依賴高端AI芯片、集群及生態(tài)。高計(jì)算性能、高通信帶寬和大顯存成為大模型訓(xùn)練必不可少的算力底座,單AI芯片進(jìn)步速度還未跟上大模型對大算力的需求,算力集群化成為不可逆轉(zhuǎn)的發(fā)展趨勢。

在2023世界人工智能大會上,華為宣布昇騰AI集群全面升級,集群規(guī)模從最初的4000卡集群擴(kuò)展至16000卡,擁有更快的訓(xùn)練速度和30天以上的穩(wěn)定訓(xùn)練周期。

胡厚崑表示,華為在各個單點(diǎn)創(chuàng)新的基礎(chǔ)上,充分發(fā)揮云、計(jì)算、存儲、網(wǎng)絡(luò)以及能源的綜合優(yōu)勢,進(jìn)行架構(gòu)創(chuàng)新,推出了昇騰AI集群,相當(dāng)于把AI算力中心當(dāng)成一臺超級計(jì)算機(jī)來設(shè)計(jì),使得昇騰AI集群性能更高,并且可靠性更高。

據(jù)他介紹,昇騰AI集群目前已經(jīng)可以達(dá)到10%以上的大模型訓(xùn)練效率的提升,可以提供10倍以上的系統(tǒng)穩(wěn)定的提高,支持長期穩(wěn)定訓(xùn)練。

華為昇騰計(jì)算業(yè)務(wù)總裁張迪煊表示,基于昇騰AI,原生孵化和適配了30多個大模型,到目前為止,中國有一半左右的大模型創(chuàng)新,都是由昇騰AI來支持的。

除了華為,阿里、騰訊等也打造了較大的算力集群,不過主要還是依靠英偉達(dá)的GPU芯片。阿里云表示,其擁有國內(nèi)最強(qiáng)的智能算力儲備,智算集群可支持最大十萬卡GPU規(guī)模,承載多個萬億參數(shù)大模型同時在線訓(xùn)練。

騰訊云此前大量采購了英偉達(dá)A100/H800芯片,發(fā)布新一代HCC高性能計(jì)算集群,用于大模型訓(xùn)練、自動駕駛、科學(xué)計(jì)算等領(lǐng)域?;谛乱淮?,騰訊團(tuán)隊(duì)在同等數(shù)據(jù)集下,將萬億參數(shù)的AI大模型混元NLP訓(xùn)練由50天縮短到4天。

小結(jié)

無論是大模型的訓(xùn)練,還是后期的推理部署,對算力的需求都相當(dāng)大。雖然,當(dāng)前國產(chǎn)AI芯片與國際領(lǐng)先GPU產(chǎn)品在大模型的訓(xùn)練上有差距,不過可以看到,已經(jīng)有不少產(chǎn)品,在較大模型的訓(xùn)練上已經(jīng)取得成績,后續(xù)必然還會有更大的進(jìn)展。同時,為了滿足大模型對大算力的需求,算力集群化將會是未來趨勢。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29806

    瀏覽量

    268106
收藏 人收藏

    評論

    相關(guān)推薦

    小鵬汽車圖靈芯片及L4自動駕駛新進(jìn)展

    的特定領(lǐng)域架構(gòu),進(jìn)一步提升了其處理能力。 據(jù)悉,小鵬汽車已在今年10月份成功在圖靈芯片上跑通了智能駕駛功能,這標(biāo)志著公司在智能駕駛領(lǐng)域取得了重要進(jìn)展。 除了圖靈芯片,何小鵬還透露了小鵬汽車在L4級自動駕駛方面的
    的頭像 發(fā)表于 11-08 11:01 ?546次閱讀

    芯片和封裝級互連技術(shù)的最新進(jìn)展

    近年來,計(jì)算領(lǐng)域發(fā)生了巨大變化,通信已成為系統(tǒng)性能的主要瓶頸,而非計(jì)算本身。這一轉(zhuǎn)變使互連技術(shù) - 即實(shí)現(xiàn)計(jì)算系統(tǒng)各組件之間數(shù)據(jù)交換的通道 - 成為計(jì)算機(jī)架構(gòu)創(chuàng)新的焦點(diǎn)。本文探討了通用、專用和量子計(jì)算系統(tǒng)中芯片和封裝級互連的最新進(jìn)展,并強(qiáng)調(diào)了這一快速發(fā)展領(lǐng)域的關(guān)鍵技術(shù)、挑
    的頭像 發(fā)表于 10-28 09:50 ?280次閱讀

    AI模型的最新研究進(jìn)展

    AI模型的最新研究進(jìn)展體現(xiàn)在多個方面,以下是對其最新進(jìn)展的介紹: 一、技術(shù)創(chuàng)新與突破 生成式AI技術(shù)的爆發(fā) : 生成式
    的頭像 發(fā)表于 10-23 15:19 ?245次閱讀

    一體架構(gòu)創(chuàng)新助力國產(chǎn)AI芯片騰飛

    在灣芯展SEMiBAY2024《AI芯片與高性能計(jì)算(HPC)應(yīng)用論壇》上,億鑄科技高級副總裁徐芳發(fā)表了題為《存一體架構(gòu)創(chuàng)新助力國產(chǎn)
    的頭像 發(fā)表于 10-23 14:48 ?196次閱讀

    【「大模型時代的基礎(chǔ)架構(gòu)」閱讀體驗(yàn)】+ 未知領(lǐng)域的感受

    國慶前就收到《大模型時代的基礎(chǔ)架構(gòu)》一書,感謝電子發(fā)燒友論壇。歡度國慶之余,今天才靜下心來體驗(yàn)此書,書不厚,200余頁,彩色圖例,印刷精美! 當(dāng)初申請此書,主要是看到副標(biāo)題“大模型
    發(fā)表于 10-08 10:40

    開啟全新AI時代 智能嵌入式系統(tǒng)快速發(fā)展——“第六屆國產(chǎn)嵌入式操作系統(tǒng)技術(shù)與產(chǎn)業(yè)發(fā)展論壇”圓滿結(jié)束

    計(jì)算機(jī)學(xué)院牛建偉教授主持。 中科院軟件所副所長、總工程師,武延軍研究員做了“AI模型時代下的操作系統(tǒng)發(fā)展思考”主題演講。 武延軍介紹了操作系統(tǒng)的發(fā)展歷程,指出應(yīng)用的高速發(fā)展給操作系統(tǒng)帶來的
    發(fā)表于 08-30 17:24

    模型時代需求

    現(xiàn)在AI已進(jìn)入大模型時代,各企業(yè)都爭相部署大模型,但如何保證大模型
    發(fā)表于 08-20 09:04

    名單公布!【書籍評測活動NO.41】大模型時代的基礎(chǔ)架構(gòu):大模型中心建設(shè)指南

    工作日內(nèi)未聯(lián)系,視為放棄本次試用評測資格! 書籍介紹 大模型是近年來引人注目的熱點(diǎn)之一。大模型蓬勃發(fā)展的基礎(chǔ),是針對其需求設(shè)計(jì)的及基礎(chǔ)架構(gòu)。本書針對如何為大
    發(fā)表于 08-16 18:33

    萬卡集群解決大模型訓(xùn)需求,建設(shè)面臨哪些挑戰(zhàn)

    解決大模型訓(xùn)練對需求的巨大增長問題,尤其是現(xiàn)在模型參數(shù)量從百億級、千億級邁向萬億級。 ? 國內(nèi)外企業(yè)積極構(gòu)建萬卡集群 ? 目前,在國際上
    的頭像 發(fā)表于 06-02 06:18 ?4512次閱讀
    萬卡<b class='flag-5'>集群</b>解決大<b class='flag-5'>模型</b>訓(xùn)<b class='flag-5'>算</b><b class='flag-5'>力</b>需求,建設(shè)面臨哪些挑戰(zhàn)

    摩爾線程張建中:以國產(chǎn)助力數(shù)智世界,滿足大模型需求

    摩爾線程創(chuàng)始人兼CEO張建中在會上透露,為了滿足國內(nèi)對AI的迫切需求,他們正在積極尋求與國內(nèi)頂尖科研機(jī)構(gòu)的深度合作,共同推動更大規(guī)模的AI
    的頭像 發(fā)表于 05-10 16:36 ?797次閱讀

    百度首席技術(shù)官王海峰解讀文心大模型的關(guān)鍵技術(shù)和最新進(jìn)展

    4月16日,以“創(chuàng)造未來”為主題的Create 2024百度AI開發(fā)者大會在深圳國際會展中心成功舉辦。百度首席技術(shù)官王海峰以“技術(shù)筑基,星河璀璨”為題,發(fā)表演講,解讀了智能體、代碼、多模型等多項(xiàng)文心大模型的關(guān)鍵技術(shù)和
    的頭像 發(fā)表于 04-18 09:20 ?642次閱讀
    百度首席技術(shù)官王海峰解讀文心大<b class='flag-5'>模型</b>的關(guān)鍵技術(shù)和<b class='flag-5'>最新進(jìn)展</b>

    中國電信規(guī)劃在上海建設(shè)首個國產(chǎn)超大規(guī)模液冷集群

    中國電信規(guī)劃建設(shè)首個國產(chǎn)超大規(guī)模液冷集群 人工智能技術(shù)的快速發(fā)展催生了巨大的需求;中國電
    的頭像 發(fā)表于 02-22 18:48 ?1289次閱讀

    兩家企業(yè)有關(guān)LED項(xiàng)目的最新進(jìn)展

    近日,乾富半導(dǎo)體與英創(chuàng)兩家企業(yè)有關(guān)LED項(xiàng)目傳來最新進(jìn)展
    的頭像 發(fā)表于 01-15 13:37 ?645次閱讀

    AI模型在端側(cè)加速落地已成必然趨勢,芯片廠商提前布局!

    普遍認(rèn)為,2024年AI模型在商業(yè)應(yīng)用會有極大突破。 ? “AI模型在端側(cè)的加速落地已成必然趨勢。”在星宸科技上周舉辦的2023開發(fā)者大
    的頭像 發(fā)表于 12-29 00:47 ?2143次閱讀
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>在端側(cè)加速落地已成<b class='flag-5'>必然趨勢</b>,<b class='flag-5'>芯片</b>廠商提前布局!

    弘信電子與AI服務(wù)器合資,助力國產(chǎn)芯片落地

    此外,弘信電子近期在AI業(yè)務(wù)上取得了突破性進(jìn)展,這并非源自本土化的積累,而是依賴于團(tuán)隊(duì)敏銳的戰(zhàn)略眼光和強(qiáng)烈的創(chuàng)新動力。此次投資是弘信電子在AI
    的頭像 發(fā)表于 12-25 09:30 ?787次閱讀