0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

能效比較GPGPU高一個數(shù)量級,國產(chǎn)AI芯片讓端側(cè)AI大模型高質(zhì)量落地

吳生semi ? 來源:電子發(fā)燒友網(wǎng) ? 作者:吳子鵬 ? 2024-07-10 16:28 ? 次閱讀
電子發(fā)燒友網(wǎng)報道(文/吳子鵬)2024年世界人工智能大會(以下簡稱:WAIC 2024)依然是一場“百模大戰(zhàn)”,不過有一些很明顯的變化是:新推出的AI大模型更加注重用戶體驗;邊側(cè)和端側(cè)承載AI大模型的方案越來越多。也就是說,AI大模型不僅完成了從“能用”到“好用”的蛻變,也從高高在上的云端,走到更靠近應用場景的邊側(cè)和端側(cè),這給作為方案核心的推理芯片提出了非常高的要求。

在愛芯元智于WAIC 2024舉辦的“芯領未來丨智能芯片及多模態(tài)大模型論壇”上,愛芯元智創(chuàng)始人、董事長仇肖莘在主旨演講中表示,大模型真正大規(guī)模落地需要云邊端三級緊密結(jié)合,而邊側(cè)和端側(cè)結(jié)合的關鍵在于高能效的邊端AI芯片。
愛芯元智創(chuàng)始人、董事長仇肖莘
仇肖莘指出,目前基于愛芯元智AI芯片已經(jīng)完成非常多款AI大模型的適配,能夠支持的參數(shù)規(guī)模覆蓋0.3B-7B?!按钶dAI處理器的高效推理芯片將是大模型落地更合理的選擇,這也是推進普惠AI的關鍵所在。”

愛芯智眸AI-ISP和愛芯通元NPU
在AI芯片的研發(fā)上,愛芯元智打造了廣受業(yè)界認可的愛芯智眸AI-ISP和愛芯通元混合精度NPU兩大自研核心技術(shù)。其中,愛芯智眸AI-ISP是將深度學習算法與傳統(tǒng)的ISP處理單元相結(jié)合,利用像素級AI處理技術(shù),在各種復雜應用場景中,全面提升成像效果,為后期智能處理提供高質(zhì)量的圖像、視頻素材,作為萬物智能的“眼睛”感知更多信息,特別是暗光全彩的剛需。

愛芯通元混合精度NPU是以算子為原子指令集的AI計算處理器,采用多線程異構(gòu)多核設計,實現(xiàn)算子、網(wǎng)絡微結(jié)構(gòu)、數(shù)據(jù)流和內(nèi)存訪問優(yōu)化,高效支持混合精度算法設計,原生支持Transformer網(wǎng)絡結(jié)構(gòu),為大模型在邊緣側(cè)、端側(cè)的應用提供良好的基礎。

仇肖莘談到,愛芯元智現(xiàn)階段奉行以“AIoT+ADAS”為主的一體兩翼戰(zhàn)略路線,在AI大模型進入邊側(cè)和端側(cè)的過程中,智慧城市和智能汽車都是非常具有代表性的應用場景?!澳壳岸藗?cè)大模型落地依然在前期探索階段,我認為智能汽車、AI手機和AIPC將會是第一批落地的場景,智能駕駛之所以需要端側(cè)大模型原因在于汽車對實時性的要求更高?!?br />
愛芯智眸AI-ISP作為AI芯片的子系統(tǒng),為解決很多端側(cè)場景圖像問題提供了強力支持。比如在智能駕駛場景中,愛芯智眸AI-ISP提供AI星光全彩、AI HDR成像、AI多光譜融合、AI防抖、AI場景增強、AI多傳感器融合六大技術(shù)亮點,能夠幫助智能汽車在大雨、大霧、夜間和隧道等惡劣的駕駛環(huán)境中獲取清晰的圖像。

當然,AI技術(shù)的發(fā)展也在推動AI-ISP的創(chuàng)新。以愛芯智眸AI-ISP來說,目前AI算法已經(jīng)取代了降噪模塊、防抖模塊。仇肖莘認為,后續(xù)AI-ISP發(fā)展一個值得探索的方向是,AI-ISP是不是也能夠成為一個“黑盒式”的AI大模型,用AI算法取代更多ISP中的功能單元,使得AI-ISP能夠利用CMOS圖像傳感器信號直接成像,讓用戶不必再去考慮ISP工作的中間環(huán)節(jié)。

在AI芯片的打造上,愛芯通元混合精度NPU的優(yōu)點不只是原生支持Transformer網(wǎng)絡結(jié)構(gòu),還包括通過可編程數(shù)據(jù)流DSA架構(gòu),能夠覆蓋目前用戶需要的基本算子,成本、效能和運算效率都非常高。仇肖莘說,“AI算法發(fā)展至今已經(jīng)非常成熟,進入一個較為穩(wěn)定的狀態(tài),因此用戶對于算子的需求不再有日新月異的變化,這是愛芯元智能夠打造通用AI處理器的關鍵?!?br />
根據(jù)愛芯元智聯(lián)合創(chuàng)始人、副總裁劉建偉的介紹,此次論壇上正式發(fā)布的愛芯通元AI處理器在高中低三檔算力中已完成布局,并在智慧城市和輔助駕駛兩個領域?qū)崿F(xiàn)了規(guī)?;慨a(chǎn),能效比較GPGPU芯片提升了一個數(shù)量級,而在以文搜圖、通用檢測、以圖生文、AI Agent等通用大模型應用中,愛芯通元AI處理器也可以讓AI開發(fā)者以更低的成本進行高效開發(fā)。
愛芯元智聯(lián)合創(chuàng)始人、副總裁劉建偉
讓端側(cè)更好地承載AI大模型 根據(jù)《2024年中國AI大模型產(chǎn)業(yè)發(fā)展報告》,截至2024年3月,國內(nèi)部署大模型的企業(yè)數(shù)量超243家,以通用大模型為主。不過,我們都知道AI大模型成功的關鍵在于行業(yè)大模型、端側(cè)、端云結(jié)合等多種模式并行。 端側(cè)大模型的部署所面臨的挑戰(zhàn)和云端是完全不同的,需要克服能耗的限制,還需要在足夠小的參數(shù)下,做到大部分日常工作。在WAIC 2024上,愛芯元智在自己的展臺上也展示了其AI芯片在部署端側(cè)大模型方面的能力。

案例一是基于愛芯元智端側(cè)小芯片AX630C部署語言大模型——阿里云通義千問Qwen2.0。AX630C提供3.2T的算力,通過運載通義千問Qwen2.0,可以流暢地實現(xiàn)人機對話,查詢信息、日常交流等任務。AX630C運載通義千問Qwen2.0每秒能處理超過10個信息單元,但功耗只有1.5瓦。

案例二是愛芯元智端AX650N結(jié)合CLIP模型可以實現(xiàn)以文搜圖的功能,只需要一個詞、一句話或一段文字,系統(tǒng)就能迅速準確地從海量圖片中找到匹配項。

案例三是基于愛芯元智端AX650N運轉(zhuǎn)多模態(tài)多維感知大模型OWL-ViT大模型,精準完成對未知目標檢測,實現(xiàn)圖像自動標簽化。

正如上文提到的,愛芯通元AI處理器提供完備的算子集合,因此對于市面上的大模型能夠提供非常好的支持,并且適配的速度是非??斓摹1热?,今年4月份,Meta發(fā)布了Meta Llama 3系列語言模型(LLM),具體包括一個8B模型和一個70B模型。隨后不久,愛芯元智就宣布,愛芯通元AI處理器完成Llama 3和Phi-3大模型適配。在Llama 3模型的適配上,愛芯元智AX650N芯片適配了Llama 3 8B Int8版本,若采用Int4量化,每秒token數(shù)還能再翻一倍,能滿足正常的人機交流。仇肖莘強調(diào),愛芯元智的AI芯片對INT2、INT4、INT8、INT16混合精度算力都可以支持。


結(jié)語
AI大模型的發(fā)展已經(jīng)進入一個新階段,行業(yè)大模型以及云邊端結(jié)合的大模型是下一步發(fā)展重點。在端側(cè)運轉(zhuǎn)大模型有不一樣的挑戰(zhàn),能耗和參數(shù)規(guī)模都會受到限制,但用戶體驗不能打折。愛芯通元AI處理器以及愛芯元智AX650N等AI芯片展示出了非常好的端側(cè)大模型支持能力,在普惠AI的道路上邁出了堅實一步。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI芯片
    +關注

    關注

    17

    文章

    1828

    瀏覽量

    34664
  • GPGPU
    +關注

    關注

    0

    文章

    26

    瀏覽量

    4853
  • 愛芯元智
    +關注

    關注

    1

    文章

    65

    瀏覽量

    4658
  • AI大模型
    +關注

    關注

    0

    文章

    281

    瀏覽量

    213
收藏 人收藏

    評論

    相關推薦

    Meta推出革命性3D Gen AI模型:1分鐘內(nèi)生成高質(zhì)量3D內(nèi)容

    在科技日新月異的今天,Meta再次引領創(chuàng)新潮流,宣布了項令人矚目的技術(shù)突破——3D Gen AI模型的誕生。這款先進的模型以其前所未有的高效性與卓越品質(zhì),重新定義了3D內(nèi)容創(chuàng)作的邊界
    的頭像 發(fā)表于 07-04 18:12 ?871次閱讀

    后摩智能引領AI芯片革命,推出邊模型AI芯片M30

    在人工智能(AI)技術(shù)飛速發(fā)展的今天,AI模型的部署需求正迅速從云端向側(cè)和邊緣側(cè)設備遷移。這
    的頭像 發(fā)表于 06-28 15:13 ?496次閱讀

    Opera瀏覽器引領潮流,全球首接側(cè)AI模型

    昆侖萬維旗下海外平臺Opera宣布,其旗艦瀏覽器Opera One和游戲瀏覽器Opera GX將正式接入側(cè)AI模型,成為全球首個實現(xiàn)這
    的頭像 發(fā)表于 06-03 09:18 ?532次閱讀

    存內(nèi)計算WTM2101編譯工具鏈 資料

    工藝條件下將AI計算效率提升2個數(shù)量級,充分滿足快速發(fā)展的神經(jīng)網(wǎng)絡模型指數(shù)級增長的算力需求。 witin_mapper是知存科技自研的用于神經(jīng)網(wǎng)絡映射的編譯軟件棧,可以將量化后的神經(jīng)網(wǎng)絡模型
    發(fā)表于 05-16 16:33

    開發(fā)者手機 AI - 目標識別 demo

    Lite的API接口實現(xiàn)主要功能; Mindspore Lite為Openharmony AI推理框架,為上層應用提供統(tǒng)AI推理接口,可以完成在手機等
    發(fā)表于 04-11 16:14

    通義千問首次落地天璣9300移動平臺!阿里云攜手MediaTek探索側(cè)AI智能體

    ,實現(xiàn)手機AI體驗的大幅提升。這是通義大模型首次完成芯片級的軟硬適配,僅依靠終端算力便能擁有極佳的推理性能及功耗表現(xiàn),標志著Model-on-Chip的探索正式從驗證走向商業(yè)化落地新階
    發(fā)表于 03-28 10:51 ?183次閱讀
    通義千問首次<b class='flag-5'>落地</b>天璣9300移動平臺!阿里云攜手MediaTek探索<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>智能體

    防止AI模型被黑客病毒入侵控制(原創(chuàng))聆思大模型AI開發(fā)套件評測4

    在訓練只聰明的AI小動物解決實際問題,通過構(gòu)建神經(jīng)網(wǎng)絡模型并進行推理,電腦也像人樣根據(jù)輸
    發(fā)表于 03-19 11:18

    榮耀引領側(cè)AI新時代

    在今年的MWC盛會上,榮耀宣布與高通、Meta攜手,將70億參數(shù)大模型引入側(cè),這創(chuàng)新舉措預示著側(cè)
    的頭像 發(fā)表于 03-01 10:28 ?465次閱讀

    AI模型怎么解決芯片過剩?

    AI模型
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2024年01月02日 15:42:05

    AI模型側(cè)加速落地已成必然趨勢,芯片廠商提前布局!

    普遍認為,2024年AI模型在商業(yè)應用會有極大突破。 ? “AI模型側(cè)的加速
    的頭像 發(fā)表于 12-29 00:47 ?1952次閱讀
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>在<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>加速<b class='flag-5'>落地</b>已成必然趨勢,<b class='flag-5'>芯片</b>廠商提前布局!

    清華電化學電容新突破,比容量高出電解電容兩個數(shù)量級

    相對來說,電化學電容器的比容量要比電解電容器高三個數(shù)量級,是微型化、集成化濾波電容的良好選擇,但受限于緩慢的離子遷移動力學,電化學電容器無法做到濾波需求的高頻率響應能力,因此電化學電容器往往需要以犧牲比容量的方式
    的頭像 發(fā)表于 12-06 15:39 ?636次閱讀
    清華電化學電容新突破,比容量高出電解電容兩<b class='flag-5'>個數(shù)量級</b>

    AI模型接入手機,行業(yè)迎來新輪競賽

    選擇側(cè)部署,看上去最劃算 當前,AI模型接入手機存在兩種選擇:云端部署和側(cè)部署。 目前,大多數(shù)廠商選擇在側(cè)部署輕
    發(fā)表于 12-05 10:11 ?599次閱讀
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>接入手機,行業(yè)迎來新<b class='flag-5'>一</b>輪競賽

    智能手機+側(cè)生成式AI,聯(lián)發(fā)科天璣8300加速其普及

    的陸續(xù)發(fā)布直接成為了側(cè)生成式AI落地的助推器。 ? 天璣8300主打冰峰,超神進化。天
    的頭像 發(fā)表于 11-22 16:07 ?1246次閱讀
    智能手機+<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>生成式<b class='flag-5'>AI</b>,聯(lián)發(fā)科天璣8300加速其普及

    與GPU齊平,低功耗AI公司的轉(zhuǎn)型

    ,硬件成本已經(jīng)成了AI發(fā)展的最大瓶頸。 為了訓練高質(zhì)量AI模型,堆硬件數(shù)量幾乎是避無可避的。為此,越來越多的
    的頭像 發(fā)表于 10-23 09:03 ?1275次閱讀
    與GPU<b class='flag-5'>能</b><b class='flag-5'>效</b>齊平,低功耗<b class='flag-5'>AI</b>公司的轉(zhuǎn)型

    聯(lián)發(fā)科與vivo強強聯(lián)手,行業(yè)首次在手機側(cè)落地70億AI大語言模型

    最近,聯(lián)發(fā)科和vivo聯(lián)袂宣告了行業(yè)第的合作突破,他們成功將10億和70億AI大語言模型,以及10億AI視覺大模型的最高
    的頭像 發(fā)表于 10-18 12:40 ?797次閱讀