0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

地平線旭日3成功部署運行參數(shù)規(guī)模高達14億的大語言模型

地平線HorizonRobotics ? 來源:地平線HorizonRobotics ? 2023-09-12 09:24 ? 次閱讀

近日,地平線成功在旭日3中的BPU計算單元上,部署運行參數(shù)規(guī)模高達14億的大語言模型(Large Language Model , LLM)。這不僅是業(yè)界在端側(cè)成功部署大模型的一次突破性實踐,更驗證了BPU對先進神經(jīng)網(wǎng)絡(luò)算法的高效支持,為大模型在端側(cè)實現(xiàn)產(chǎn)品級應(yīng)用拓展了更廣闊的想象空間。

大模型端側(cè)部署的技術(shù)實踐對加速智能化產(chǎn)業(yè)變革具有重要意義。端側(cè)部署具備實時性、低時延優(yōu)勢,能夠靈活支持弱網(wǎng)或無網(wǎng)等豐富場景,為終端用戶提供更流暢、穩(wěn)定的交互體驗;同時端側(cè)支持信息本地化處理,可有效保護用戶數(shù)據(jù)與隱私安全;端側(cè)計算還將大幅緩解云端算力壓力,端云協(xié)同更會驅(qū)動產(chǎn)業(yè)降本提效,加速實現(xiàn)大模型技術(shù)的應(yīng)用普惠。

然而,大模型端側(cè)推理部署仍面臨巨大挑戰(zhàn)。區(qū)別于云端推理部署計算資源應(yīng)用盡用,端側(cè)部署大模型并實現(xiàn)產(chǎn)品級應(yīng)用,則需綜合考量不同應(yīng)用間的計算資源分配,以及計算效率、帶寬占用與功耗等各項指標。如何在眾多約束條件下最大程度地提高大模型端側(cè)推理效率是面臨的首要技術(shù)挑戰(zhàn)。此外,推理過程將大量占用內(nèi)存帶寬,如何在不影響推理結(jié)果的前提下減少內(nèi)存訪問,降低帶寬依賴,進而減少推理耗時,則需要在軟件工程層面進行系統(tǒng)優(yōu)化。

作為軟硬協(xié)同技術(shù)路徑的堅定踐行者,地平線通過硬件資源的最大化利用和軟件工程的極致優(yōu)化,并成功在5 TOPS算力的邊緣計算芯片上部署高達14億級參數(shù)的大語言模型。這源于旭日3所搭載的雙核BPU伯努利計算單元對神經(jīng)網(wǎng)絡(luò)計算的原生性支持,能夠在處理大語言模型方面提供高性能、低功耗的計算處理能力。另一方面,地平線通過軟硬協(xié)同編譯,采用算子重寫、算子重排、算子融合和KV-Cache等技術(shù),進一步優(yōu)化了模型結(jié)構(gòu),實現(xiàn)推理速度的成倍提升。

從資源占用情況看,該大語言模型在旭日3上的應(yīng)用效果表現(xiàn)優(yōu)異,CPU占用單核60%、BPU占用單核50%,為后續(xù)其他應(yīng)用預(yù)留充足的算力資源;同時在5GB/s內(nèi)存帶寬基礎(chǔ)上實現(xiàn)了約4~5字/秒的生成速度,可充分滿足實時性需求;在最能體現(xiàn)真實效能的FPS/Watt指標上,該模型的運行效能相較于LLaMA.cpp等純CPU方案提升了2.5倍。這也意味著,旭日3對此大語言模型的支持性可達到產(chǎn)品級應(yīng)用水平。

地平線現(xiàn)已通過GitHub開放該模型的推理代碼,開發(fā)者可通過RDK X3系列開發(fā)者套件,即刻前往「NodeHub全開源機器人應(yīng)用中心推薦項目(https://developer.horizon.cc/nodehub),嘗鮮體驗大語言模型在旭日3上的實際運行效果,更期待各位開發(fā)者參與「星光之路」活動,一同探索大模型在RDK X3上的上層應(yīng)用落地!

我們相信,通過軟硬協(xié)同的技術(shù)路徑,大模型端側(cè)應(yīng)用部署將驅(qū)動人機交互方式變革,多維度提升用戶智能化體驗,加速“智能計算平權(quán)”時代的到來。

審核編輯:彭菁

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4717

    瀏覽量

    100005
  • 軟件
    +關(guān)注

    關(guān)注

    69

    文章

    4570

    瀏覽量

    86696
  • 語言模型
    +關(guān)注

    關(guān)注

    0

    文章

    487

    瀏覽量

    10201
  • 地平線
    +關(guān)注

    關(guān)注

    0

    文章

    321

    瀏覽量

    14812

原文標題:5T算力BPU × 14億參數(shù)LLM,地平線旭日?3成功部署大語言模型

文章出處:【微信號:horizonrobotics,微信公眾號:地平線HorizonRobotics】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    地平線Journey 3的電源設(shè)計

    電子發(fā)燒友網(wǎng)站提供《地平線Journey 3的電源設(shè)計.pdf》資料免費下載
    發(fā)表于 09-04 10:48 ?0次下載
    <b class='flag-5'>地平線</b>Journey <b class='flag-5'>3</b>的電源設(shè)計

    地平線技術(shù)開放日:余凱勾勒智能駕駛新藍圖

    在8月28日的地平線技術(shù)開放日上,公司創(chuàng)始人兼CEO余凱以高調(diào)的姿態(tài),詳細闡述了地平線在智能駕駛領(lǐng)域的雄心壯志與商業(yè)邏輯。他不僅重申了地平線的定位,還明確了SuperDrive智能駕駛解決方案的標桿地位,并強調(diào)了軟件在芯片公司生
    的頭像 發(fā)表于 08-30 14:33 ?915次閱讀

    地平線征程家族出貨量破600萬,智駕計算方案領(lǐng)跑市場

    近日,地平線征程家族傳來振奮人心的消息,其車載智能計算方案的出貨量已正式突破600萬套大關(guān),再次刷新行業(yè)記錄,彰顯了地平線在智能駕駛領(lǐng)域的強勁實力與高速增長態(tài)勢。
    的頭像 發(fā)表于 08-22 17:17 ?530次閱讀

    地平線港股IPO獲證監(jiān)會備案

    自動駕駛領(lǐng)域的明星企業(yè)——地平線機器人(Horizon Robotics),近期獲得了中國證監(jiān)會的批準,將在香港聯(lián)合交易所進行首次公開募股(IPO)。此次IPO的順利推進,標志著地平線向資本市場邁出了重要一步。
    的頭像 發(fā)表于 08-13 15:37 ?539次閱讀

    東軟睿馳NeuSAR成功適配地平線征程6系列

    近日,東軟睿馳基礎(chǔ)軟件平臺產(chǎn)品NeuSAR完成地平線征程6系列適配,在安全、高效的軟件平臺基礎(chǔ)之上,將進一步聚焦客戶差異化需求,提供兼顧性能、體驗和量產(chǎn)效率的智能汽車基礎(chǔ)軟件平臺解決方案
    的頭像 發(fā)表于 07-29 09:27 ?982次閱讀

    地平線IPO!國內(nèi)第二大ADAS方案商,毛利率超70%,估值超80美元

    。3月26日,地平線向港交所遞交招股書,正式啟動IPO上市進程。 ? 圖源:地平線招股書 ? 國內(nèi)第二大ADAS 方案商 , 毛利率高達 70%
    的頭像 發(fā)表于 04-02 00:08 ?6439次閱讀
    <b class='flag-5'>地平線</b>IPO!國內(nèi)第二大ADAS方案商,毛利率超70%,估值超80<b class='flag-5'>億</b>美元

    智能駕駛企業(yè)地平線赴港IPO

    智能駕駛科技領(lǐng)軍企業(yè)地平線正式向香港交易所遞交上市申請,此舉立刻引起了市場對智能駕駛板塊的熱烈關(guān)注。地平線作為國內(nèi)自動駕駛芯片及解決方案的佼佼者,其在智能駕駛技術(shù)研發(fā)和市場地位上的卓越表現(xiàn)一直備受矚目。此次上市計劃的啟動,不僅將推動智能駕駛行業(yè)的資本化進程,更將為整個產(chǎn)業(yè)
    的頭像 發(fā)表于 03-29 16:32 ?665次閱讀

    智能駕駛頭部企業(yè)地平線赴港IPO

    地平線向港交所遞交了上市申請,正式啟動港股IPO進程,這一行動引起了市場的廣泛關(guān)注。在此次上市過程中,高盛、摩根士丹利以及中信建投共同擔任聯(lián)席保薦人,為地平線的上市之路提供了強大的支持。
    的頭像 發(fā)表于 03-28 16:45 ?668次閱讀

    智能駕駛領(lǐng)軍企業(yè)地平線遞表港交所

    港交所最新文件披露,智能駕駛領(lǐng)域的領(lǐng)軍企業(yè)地平線已正式提交港股上市申請。據(jù)悉,地平線在2023年實現(xiàn)了令人矚目的業(yè)績,營收達到15.5元,同比增長高達71.3%。同時,其毛利也達到了
    的頭像 發(fā)表于 03-27 16:21 ?608次閱讀

    地平線提交香港IPO申請

    智能駕駛計算方案提供商“地平線”正式遞交港股上市申請。據(jù)其公開文件,地平線在2023年實現(xiàn)了15.5元的營收,同比顯著增長71.3%,毛利達到10.94元,毛利率
    的頭像 發(fā)表于 03-27 16:11 ?532次閱讀

    地平線向港交所遞交招股書

    智能駕駛計算方案領(lǐng)軍者地平線,近日正式向港交所遞交了招股書,高盛、摩根士丹利及中信建投為其聯(lián)席保薦人。這并非地平線首次試水資本市場,早在2021年,地平線就計劃科創(chuàng)板上市,并一度傳出赴美IPO的消息,但受資本市場環(huán)境影響,其上市
    的頭像 發(fā)表于 03-27 16:02 ?437次閱讀

    地平線創(chuàng)始人余凱:已超110款量產(chǎn)車型采用地平線芯片

    自2020年以來,地平線成功與長安汽車合作推出UNI—K、UNI—T、UNI—V等產(chǎn)品;直至今年,已有近30位國內(nèi)車企成為其重要客戶,如比亞迪和理想汽車均為其智能駕駛芯片的主要采購商。
    的頭像 發(fā)表于 03-18 09:49 ?356次閱讀

    地平線正式開源Sparse4D算法

    地平線將業(yè)內(nèi)領(lǐng)先的純視覺自動駕駛算法——Sparse4D系列算法開源,推動行業(yè)更多開發(fā)者共同參與到端到端自動駕駛、稀疏感知等前沿技術(shù)方向的探索中。目前,Sparse4D算法已在GitHub平臺上線,開發(fā)者可關(guān)注地平線GitHub官方賬號“Horizon Robotics”
    的頭像 發(fā)表于 01-23 10:18 ?603次閱讀

    地平線再獲奇瑞協(xié)同創(chuàng)新特別貢獻獎

    在奇瑞汽車2024供應(yīng)鏈生態(tài)圈年會上,地平線榮獲奇瑞汽車頒發(fā)的“協(xié)同創(chuàng)新特別貢獻獎”,這也是地平線連續(xù)第二年榮獲該獎項,地平線總裁陳黎明博士受邀出席并代表公司獲頒獎項。與此同時,陳黎明博士于1月16
    的頭像 發(fā)表于 01-22 11:16 ?1032次閱讀

    地平線開啟合資車企量產(chǎn)落地 啟辰VX6搭載地平線征程3芯片以及Mono 3單目視覺感知方案

    11月3日,地平線與東風日產(chǎn)的首款量產(chǎn)合作車型——啟辰VX6正式上市,實現(xiàn)了征程芯片賦能合資車企車型的首次突破。憑借率先交出的量產(chǎn)實績,地平線正在成為合資車企智能化轉(zhuǎn)型的首選合作伙伴,助力更多車企
    的頭像 發(fā)表于 11-10 20:32 ?2141次閱讀