0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

發(fā)展大模型,是否解決算力問題就夠了?

半導體產(chǎn)業(yè)縱橫 ? 來源:半導體產(chǎn)業(yè)縱橫 ? 2023-08-21 16:03 ? 次閱讀

隨著大模型概念火熱,算力成為各行各業(yè)關注的熱門話題英偉達顯卡被搶爆,媒體關注“大模型時代到來,算力夠不夠”,行業(yè)想要解決AIGC時代的算力瓶頸問題。然而,發(fā)展大模型,是否解決算力問題就夠了?

01 算力是大模型的底座

大模型是在智能算力驅動下最為典型的重大創(chuàng)新。得益于模型泛化能力強、長尾數(shù)據(jù)的低依賴性、以及下游模型使用效率的提升,大模型被認為具備了“通用智能”的雛形,并成為業(yè)內(nèi)探索實現(xiàn)普惠人工智能的重要途徑之一。從算力的視角看,語言類、視覺類模型容量和相應的算力需求都在快速擴大,大模型發(fā)展的背后是龐大的算力支撐。作為算法的結晶,需要處理大量的數(shù)據(jù)。人工智能背后需要大量的硬件支撐,已經(jīng)成了新時代的“重工業(yè)產(chǎn)品。

算力決定了數(shù)據(jù)處理能力的強弱。算力芯片是算力的具體載體,高算力芯片能夠提供超算算力、通用算力、智能算力和邊緣算力。搭載率最高的GPU芯片多用于圖形圖像處理、復雜的數(shù)學計算等場景,可較好支持高度并行的工作負載,經(jīng)常用于數(shù)據(jù)中心的模型訓練,或用于邊緣側和端側的推理工作負載。

服務器是算力的基礎設施之一。服務器的邏輯架構和普通計算機類似,但是由于需要提供高性能計算,因此在處理能力、穩(wěn)定性、可靠性、安全性、可擴展性、可管理性等方面要求較高。人工智能服務器由于具備圖形渲染和海量數(shù)據(jù)的并行運算等優(yōu)勢,能夠快速準確地處理大量數(shù)據(jù),市場價值逐漸凸顯。

隨著數(shù)據(jù)應用的搭載率較低的NPU芯片,設計邏輯則更為簡單,常用于邊側和端側的模型推理,并生成結果,在處理推理工作負載時,具有顯著的能耗節(jié)約優(yōu)勢。根據(jù)IDC統(tǒng)計,2021年中國仍以GPU為主實現(xiàn)數(shù)據(jù)中心計算加速,市場占有率近90%,ASIC、FPGA、NPU等非GPU芯片市場占有率超過10%。據(jù)IDC預計,到2025年人工智能芯片市場規(guī)?;驅⑦_726億美元。

IDC數(shù)據(jù)顯示,2021年全球人工智能服務器市場的同比增速超過全球整體人工智能市場的增速,是整體人工智能市場增長的推動力。IDC發(fā)布的《全球人工智能市場半年度追蹤報告》顯示,2021年全球人工智能服務器市場規(guī)模達156.3億美元,約合人民幣1,045億元,這是全球年度人工智能服務器市場首次突破千億元人民幣,同比2020年增速達39.1%。

這樣的背景下,國內(nèi)算力芯片公司“快馬揚鞭”。例如,龍芯中科計劃明年下半年將完成兼顧顯卡和算力加速功能的專用芯片流片;龍芯GPU的定位主要是為了與CPU形成自我配套,形成系統(tǒng)優(yōu)勢,降低系統(tǒng)成本。

02 國產(chǎn)存力需要重視

數(shù)據(jù)存力指的是以存儲容量為核心,包含性能表現(xiàn)、安全可靠、綠色低碳在內(nèi)的綜合能力。

在國家數(shù)字經(jīng)濟大戰(zhàn)略下,數(shù)據(jù)作為生產(chǎn)要素,已成為重要的資產(chǎn)。隨著海量數(shù)據(jù)呈指數(shù)級增長,數(shù)據(jù)流動加速,存儲作為承載數(shù)據(jù)的關鍵設施,其重要性更加凸顯。作為數(shù)據(jù)大國,數(shù)據(jù)存儲產(chǎn)業(yè)就需要跟上。大模型正在帶動各地建設AI算力中心,但是產(chǎn)業(yè)主要關心的都是運算力。倪光南院士認為算力中心的計算能力由三個因素決定:存力、算力、運力。倪光南院士認為,用廣義算力去定義一個算力中心,才更準確。如果去計算存算比的話,美國的算力中心存算比為1.11TB/GFlops,中國約為美國的37.8%。

我國數(shù)據(jù)存力發(fā)展總體水平與發(fā)達國家相比仍有一定差距。據(jù)羅蘭公司測算,美國單位GDP存儲容量高于我國,我國存儲在經(jīng)濟發(fā)展中的支撐作用有待加強。據(jù)中國信通院統(tǒng)計,2021年我國存儲總量容量已達800EB,出貨量年均增長速度已達50%。

為了發(fā)展國產(chǎn)算力,在技術方面,需要加快部署下一代存儲技術,推動存儲核心技術底層研發(fā)和技術攻關,提升存儲介質、安全設計、數(shù)據(jù)防護等關鍵技術水平,打造全球存儲的創(chuàng)新高地。存儲領域正在發(fā)生一場新的技術變革,即基于半導體技術的新型產(chǎn)品替代基于機械技術的傳統(tǒng)產(chǎn)品,這一個正在加速進行的客觀趨勢。SSD可以實現(xiàn)用先進的壓縮算法,把數(shù)據(jù)更好地壓縮,可以去重,可以更好的加密解密,用新的文件系統(tǒng)等等。

在標準方面,應盡快研究建立存儲的行業(yè)規(guī)范和標準,完善數(shù)據(jù)存儲效率、數(shù)據(jù)保護、數(shù)據(jù)災備、綠色低碳等數(shù)據(jù)存力關鍵標準體系。存儲相關企業(yè)及研究機構進行標準和評估體系研究,鼓勵行業(yè)龍頭企業(yè)通過硬件開放、軟件開源、使能生態(tài)伙伴等策略,給予合作伙伴尤其是創(chuàng)新型小微企業(yè)充分的發(fā)展空間,共同摸索形成存儲行業(yè)標準;另一方面,推進數(shù)據(jù)存儲產(chǎn)業(yè)國際交流與合作,加強與國際標準組織的合作,加速我國技術標準的國際化進程,積極參與數(shù)據(jù)存儲國際規(guī)則和技術標準制定。

在人才培養(yǎng)方面,存力市場有必要進一步完善數(shù)據(jù)產(chǎn)業(yè)人才培養(yǎng)機制,建立多層次、多元化的人才培養(yǎng)系統(tǒng),鼓勵培養(yǎng)專業(yè)理論與行業(yè)知識兼?zhèn)涞膹秃闲腿瞬?,鼓勵地方政府引導企業(yè)完善人才激勵機制,引進和留住高端存儲專業(yè)人才,優(yōu)化人才的地域和行業(yè)布局。存力產(chǎn)業(yè),包括數(shù)據(jù)存儲,數(shù)據(jù)管理技術。目前國內(nèi)對存儲的概念還停留在一個小的部件,沒有把它上升到一個產(chǎn)業(yè)的高度。

有強大先進的數(shù)據(jù)存儲產(chǎn)業(yè)作為支撐,才能有發(fā)展算力主動權。

03 國產(chǎn)運力,沉默的搬運工

如果說存力已經(jīng)開始逐漸受到重視,那么國產(chǎn)運力相對來說可能還是一個“小透明”。但對于大模型訓練來說,“運力”已經(jīng)成為關鍵因素。英特爾公司高級副總裁兼網(wǎng)絡與邊緣事業(yè)部總經(jīng)理Sachin Katti表示,在云端訓練大模型,單個服務器已無法承載,對網(wǎng)絡需求的高要求前所未有,“我們訓練一個大模型就需要5萬-20萬臺服務器,需要通過網(wǎng)絡來把這些服務器連接起來然后進行訓練,這個量是非常大的。”

數(shù)字世界的運力,指的是數(shù)據(jù)傳輸流轉的能力,由帶寬、時延、安全可靠等要素組成。面對強勁的算力需求,英偉達推出了云算力平臺,企業(yè)可以租用算力,谷歌、微軟AZURE等云算力平臺會為其提供算力支持。而與租用的服務器的鏈接也會成為影響企業(yè)模型訓練的因素。

各類智能化應用的普及,導致大量視頻數(shù)據(jù)、科研數(shù)據(jù)需要流動、調(diào)度、分析處理,帶來的網(wǎng)絡壓力和運力負擔也越來越大。

中國移動通信研究院發(fā)布的《面向AI大模型的智算中心網(wǎng)絡演進白皮書》測算,以1750億參數(shù)規(guī)模的GPT-3模型訓練為例,從理論估算模型分析,當動態(tài)時延從10us提升至1000us時,GPU有效計算時間占比將降低接近10%;當網(wǎng)絡丟包率為千分之一時,GPU有效計算時間占比將下降13%;當網(wǎng)絡丟包率達到1%時,GPU有效計算時間占比將低于5%?!叭绾谓档陀嬎阃ㄐ艜r延、提升網(wǎng)絡吞吐是AI大模型智算中心能夠充分釋放算力的核心問題?!?/p>

對于大模型來說,在訓練大模型時,模型參數(shù)存儲于加速器(如GPU顯卡)的片外緩存中,隨著訓練進程對模型參數(shù)進行不斷更新迭代。在訓練過程中,不同加速器之間需要進行頻繁且大量的數(shù)據(jù)交換,在數(shù)據(jù)交換完成之后,才能夠去算下一步的訓練結果。從這個角度來說,好“運”,才能好“算”。在這一點上,英特爾除了提供CPU、獨立顯卡等芯片,滿足人工智能模型訓練、推理對算力的要求外,也提供了針對網(wǎng)絡的IPU(Infrastructure Processing Unit)產(chǎn)品。

從這一角度來看,在AI芯片賽道已經(jīng)有巨頭把控且新玩家層出不窮的情況下,布局運力系統(tǒng)或許是另一片藍海。更重要的是,從宏觀角度來看,運力是將算力和存力高效傳輸給終端用戶,它在基礎設施中起到非常重要的作用。以被熟知的“東數(shù)西算”工程為例,它還包含西數(shù)西算、南數(shù)南算、東數(shù)西存等,而實現(xiàn)這些規(guī)劃的前提是要有強有力的運力做支撐。運力網(wǎng)絡要讓用戶在調(diào)用成百上千公里以外的計算資源時的體驗與調(diào)用隔壁工作站的資源沒什么區(qū)別。對于一個城市的大數(shù)據(jù)中心,就需要實現(xiàn)城市乃至國家層面綜合調(diào)度的能力。

在“三力”基礎上打造智慧管控能力,實現(xiàn)高效調(diào)度,才有希望實現(xiàn)算力一體化服務。不久前,成都最新發(fā)布政策,指出將圍繞“算力”“存力”“運力”等關鍵領域,大力發(fā)展芯片、服務器整機、液冷設備等高端硬件。顯然,行業(yè)已經(jīng)意識到,對于發(fā)展大模型,全面發(fā)展不能僅堆算力芯片。






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 存儲器
    +關注

    關注

    38

    文章

    7366

    瀏覽量

    163091
  • 加速器
    +關注

    關注

    2

    文章

    785

    瀏覽量

    37147
  • 數(shù)據(jù)存儲

    關注

    5

    文章

    947

    瀏覽量

    50759
  • 人工智能
    +關注

    關注

    1787

    文章

    46061

    瀏覽量

    234993
  • GPU芯片
    +關注

    關注

    1

    文章

    303

    瀏覽量

    5747

原文標題:發(fā)展國產(chǎn)大模型,不能只堆算力

文章出處:【微信號:ICViews,微信公眾號:半導體產(chǎn)業(yè)縱橫】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    摩爾線程GPU算底座助力大模型產(chǎn)業(yè)發(fā)展

    以大模型為代表的新一代人工智能技術是引領新一輪科技革命和產(chǎn)業(yè)變革的戰(zhàn)略性技術和重要驅動力量,隨著對算需求的日益高漲,人工智能算底座公司日益成為新一波人工智能技術浪潮重要組成部分。
    的頭像 發(fā)表于 08-27 16:15 ?430次閱讀

    tina是否可以用pspice模型?還有spice,hspice和pspice模型有什么區(qū)別?

    tina是否可以用pspice模型?還有spice,hspice和pspice模型有什么區(qū)別?
    發(fā)表于 08-23 06:20

    模型時代的算需求

    現(xiàn)在AI已進入大模型時代,各企業(yè)都爭相部署大模型,但如何保證大模型的算,以及相關的穩(wěn)定性和性能,是一個極為重要的問題,帶著這個極為重要的問題,我需要在此書中找到答案。
    發(fā)表于 08-20 09:04

    【書籍評測活動NO.41】大模型時代的基礎架構:大模型中心建設指南

    書籍介紹 大模型是近年來引人注目的熱點之一。大模型蓬勃發(fā)展的基礎,是針對其需求設計的算及基礎架構。本書針對如何為大模型構建基礎架構進行深入
    發(fā)表于 08-16 18:33

    OPA855是否有ADS模型呢?

    用Pspice for TI仿真了OPA855,后續(xù)設計中請問如何使用Pspice for TI仿真S參數(shù)文件?或者OPA855是否有ADS模型
    發(fā)表于 08-02 14:24

    波特五模型和swot分析的區(qū)別

    波特五模型和SWOT分析是兩種常用的戰(zhàn)略分析工具,它們在企業(yè)戰(zhàn)略規(guī)劃和管理中發(fā)揮著重要作用。盡管它們都用于評估企業(yè)的競爭環(huán)境和內(nèi)部條件,但它們在分析方法、側重點和應用范圍等方面存在明顯的區(qū)別
    的頭像 發(fā)表于 07-05 14:39 ?1124次閱讀

    什么是波特五模型,如何應用

    波特五模型(Porter's Five Forces Model)是邁克爾·波特(Michael E. Porter)于1979年提出的,用于分析行業(yè)競爭狀況和企業(yè)競爭戰(zhàn)略的一種理論模型。波特五
    的頭像 發(fā)表于 07-05 14:36 ?531次閱讀

    簡述使用波特五模型的三個步驟

    波特五模型(Porter's Five Forces Model)是邁克爾·波特(Michael E. Porter)于1979年提出的一個分析行業(yè)競爭態(tài)勢的框架。它通過分析五個方面的力量,幫助
    的頭像 發(fā)表于 07-05 14:34 ?296次閱讀

    AI大模型發(fā)展歷程和應用前景

    隨著人工智能技術的飛速發(fā)展,AI大模型逐漸成為研究與應用領域的熱點。AI大模型,顧名思義,是指具有巨大參數(shù)量的深度學習模型,這些模型通過學習
    的頭像 發(fā)表于 07-03 18:20 ?818次閱讀

    【大規(guī)模語言模型:從理論到實踐】- 閱讀體驗

    再次感謝電子發(fā)燒友提供的書籍試讀機會。今天來分享下我在學習大模型訓練中 注意機制 的心得體會。 雖然注意機制可以顯著提高模型處理長序列數(shù)據(jù)的能力,但這也帶來了計算成本的增加。在大型
    發(fā)表于 06-07 14:44

    【大語言模型:原理與工程實踐】大語言模型的應用

    的創(chuàng)造進行結合,從而創(chuàng)造出更加豐富多樣的內(nèi)容。隨著技術的不斷發(fā)展,自動提示生成技術有望逐漸成熟。這將使大語言模型變得更加自主,能夠自行構建和改進提示詞以達到理想的結果。這將極大地提高大語言
    發(fā)表于 05-07 17:21

    【大語言模型:原理與工程實踐】揭開大語言模型的面紗

    的進步,大語言模型的應用范圍和影響將持續(xù)擴大,成為AI領域的重要推動力。其中,GPT系列模型發(fā)展尤為引人注目,從GPT到GPT-2,再到如今的GPT-4,其創(chuàng)新速度和影響
    發(fā)表于 05-04 23:55

    模型時代,嫘祖也掌握了「新質生產(chǎn)」!

    當嫘祖也開始用大模型掌握新質生產(chǎn)……
    的頭像 發(fā)表于 04-16 17:52 ?435次閱讀
    大<b class='flag-5'>模型</b>時代,嫘祖也掌握了「新質生產(chǎn)<b class='flag-5'>力</b>」!

    數(shù)據(jù)語料庫、算法框架和算芯片在AI大模型中的作用和影響

    數(shù)據(jù)語料庫、算法框架和算芯片的確是影響AI大模型發(fā)展的三大重要因素。
    的頭像 發(fā)表于 03-01 09:42 ?705次閱讀

    PODsys:大模型AI算平臺部署的開源“神器”

    模型是通用人工智能的底座,但大模型訓練對算平臺的依賴非常大。大模型平臺是指支撐大模型訓練
    的頭像 發(fā)表于 11-08 09:17 ?705次閱讀
    PODsys:大<b class='flag-5'>模型</b>AI算<b class='flag-5'>力</b>平臺部署的開源“神器”