0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

端側(cè)AI研究:2024 AI“下凡”

智能計(jì)算芯世界 ? 來源:智能計(jì)算芯世界 ? 2023-11-15 17:17 ? 次閱讀

f3eed30a-838a-11ee-939d-92fbcf53809c.png

ChatGPT是由OpenAI于2022年12月推出的對(duì)話AI模型,一經(jīng)面世便受到廣泛關(guān)注。獲得千億、萬億級(jí)別參數(shù)的大語言模型需要超大規(guī)模AI服務(wù)器集群進(jìn)行訓(xùn)練,且隨著模型不斷迭代,對(duì)云端算力的需求增加。2023年以來,以英偉達(dá)為代表的AI芯片、通信網(wǎng)絡(luò)和服務(wù)器產(chǎn)業(yè)鏈相關(guān)企業(yè)股價(jià)漲幅明顯。

(1)云側(cè)AI:數(shù)據(jù)云端匯集訓(xùn)練,模型通用性強(qiáng)。從終端采集和感知到的聲音、視頻等數(shù)據(jù)都通過網(wǎng)絡(luò)傳輸?shù)皆?a target="_blank">中心側(cè)進(jìn)行后續(xù)處理,云側(cè)的資源高度集中,存儲(chǔ)和計(jì)算能力強(qiáng),并且具有很高的通用性;

(2)端側(cè)AI:終端設(shè)備上進(jìn)行的輕型模型運(yùn)用。越來越多的 AI計(jì)算和推理工作負(fù)載在手機(jī)、筆記本電腦、XR 頭顯、汽車和其他邊緣終端上運(yùn)行,端側(cè)硬件具備一定的計(jì)算能力,以及低延遲、個(gè)性化、隱私安全的特征。

端側(cè)AI的四大優(yōu)勢(shì):隱私和安全、低延時(shí)、可靠性、低成本。

? 隱私和安全:端側(cè)AI從本質(zhì)上有助于保護(hù)用戶隱私,因?yàn)椴樵兒蛡€(gè)人信息完全保留在終端上。數(shù)據(jù)的存儲(chǔ)計(jì)算等都在本地,避免了傳到云端可能帶來的數(shù)據(jù)安全問題。對(duì)于企業(yè)和工作場(chǎng)所等場(chǎng)景中使用端側(cè)AI,這有助于解決保護(hù)公司保密信息的難題。例如,用于代碼生成的編程助手應(yīng)用可以在終端上運(yùn)行,不向云端暴露保密信息。

? 低延時(shí):當(dāng)生成式AI查詢對(duì)于云的需求達(dá)到高峰期時(shí),會(huì)產(chǎn)生大量排隊(duì)等待和高時(shí)延,甚至可能出現(xiàn)拒絕服務(wù)的情況數(shù)據(jù)的存儲(chǔ)計(jì)算在本地處理、本地響應(yīng)方面時(shí)間更短速度更快。

? 可靠性:與云端互聯(lián)的網(wǎng)絡(luò)可能不穩(wěn)定、甚至斷線。決策在本地大幅降低了數(shù)據(jù)經(jīng)過更長的通路產(chǎn)生錯(cuò)誤的幾率。終端側(cè)AI處理能夠在云服務(wù)器和網(wǎng)絡(luò)連接擁堵時(shí),提供媲美云端甚至更佳的性能。如果所有的推理案例都在云服務(wù)器上進(jìn)行,準(zhǔn)確率是79.31%;如果49.88%的推理案例在移動(dòng)端進(jìn)行,其余在云端進(jìn)行,仍可達(dá)到79.31%的云級(jí)準(zhǔn)確率。

? 低成本:隨著生成式AI模型使用量和復(fù)雜性的不斷增長,僅在云端進(jìn)行推理并不劃算。將一些處理從云端轉(zhuǎn)移到邊緣終端可減輕云基礎(chǔ)設(shè)施的壓力并減少開支。此外與云端相比,端側(cè)AI能夠以很低的能耗運(yùn)行生成式AI模型。

f41a85b8-838a-11ee-939d-92fbcf53809c.png

f41f59b2-838a-11ee-939d-92fbcf53809c.png

f42a3b3e-838a-11ee-939d-92fbcf53809c.png

f445679c-838a-11ee-939d-92fbcf53809c.png

f471e9a2-838a-11ee-939d-92fbcf53809c.png

f484d6b6-838a-11ee-939d-92fbcf53809c.png

f4943f84-838a-11ee-939d-92fbcf53809c.png

f4a0cdb2-838a-11ee-939d-92fbcf53809c.png

f4ae49a6-838a-11ee-939d-92fbcf53809c.png

f4ca1992-838a-11ee-939d-92fbcf53809c.png

f4f7853a-838a-11ee-939d-92fbcf53809c.png

f514abba-838a-11ee-939d-92fbcf53809c.png

f536f1e8-838a-11ee-939d-92fbcf53809c.png

f53b57e2-838a-11ee-939d-92fbcf53809c.png

f5474228-838a-11ee-939d-92fbcf53809c.png

f5610140-838a-11ee-939d-92fbcf53809c.png

f5968b3a-838a-11ee-939d-92fbcf53809c.png

f5abfc90-838a-11ee-939d-92fbcf53809c.png

f5bafdda-838a-11ee-939d-92fbcf53809c.png

f5c43fd0-838a-11ee-939d-92fbcf53809c.png

f5cc265a-838a-11ee-939d-92fbcf53809c.png

f5e9d6dc-838a-11ee-939d-92fbcf53809c.png

f6483218-838a-11ee-939d-92fbcf53809c.png

f6652328-838a-11ee-939d-92fbcf53809c.png

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29862

    瀏覽量

    268154
  • 語言模型
    +關(guān)注

    關(guān)注

    0

    文章

    502

    瀏覽量

    10237
  • 數(shù)據(jù)云
    +關(guān)注

    關(guān)注

    0

    文章

    9

    瀏覽量

    2573

原文標(biāo)題:端側(cè)AI研究:2024 AI“下凡”

文章出處:【微信號(hào):AI_Architect,微信公眾號(hào):智能計(jì)算芯世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    四大廠商業(yè)績大漲背后,積極探索側(cè)AI SoC芯片創(chuàng)新迭代

    電子產(chǎn)品的各個(gè)形態(tài),這也為側(cè)AI SoC芯片帶來機(jī)會(huì)。 ? 近日,多家布局端側(cè)AI的SoC廠商發(fā)布20
    的頭像 發(fā)表于 08-27 01:28 ?4139次閱讀
    四大廠商業(yè)績大漲背后,積極探索<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b> SoC芯片創(chuàng)新迭代

    側(cè)AI浪潮已來!炬芯科技發(fā)布新一代側(cè)AI音頻芯片,能效比和AI算力大幅度提升

    電子發(fā)燒友原創(chuàng) 章鷹 ? 11月5日,在深圳會(huì)展中心7號(hào)館內(nèi),炬芯科技董事長兼CEO周正宇博士帶來了《側(cè)AI芯片的未來》演講,他對(duì)側(cè)
    的頭像 發(fā)表于 11-06 09:11 ?1831次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>浪潮已來!炬芯科技發(fā)布新一代<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>音頻芯片,能效比和<b class='flag-5'>AI</b>算力大幅度提升

    飛凌微CEO邵科:車載視覺處理新品助力智駕視覺系統(tǒng)升級(jí),側(cè)AI應(yīng)用加速落地

    2024年,算力仍然是大模型持續(xù)迭代的根本動(dòng)力,AI走向側(cè)是大勢(shì)所趨。咨詢機(jī)構(gòu)IDC在今年7月發(fā)布最新預(yù)測(cè),2024年全球
    的頭像 發(fā)表于 10-31 01:17 ?4252次閱讀
    飛凌微CEO邵科:車載視覺處理新品助力智駕視覺系統(tǒng)升級(jí),<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>應(yīng)用加速落地

    定義AI Agent四大核心能力,榮耀I(xiàn)FA劇透側(cè)AI創(chuàng)新進(jìn)展

    ,榮耀CEO趙明在2024德國柏林消費(fèi)電子展(Internationale Funkausstellung Berlin,以下簡(jiǎn)稱IFA)再度帶來側(cè)AI創(chuàng)新最新進(jìn)展,首次向外界透露榮
    的頭像 發(fā)表于 09-10 11:42 ?215次閱讀
    定義<b class='flag-5'>AI</b> Agent四大核心能力,榮耀I(xiàn)FA劇透<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>創(chuàng)新進(jìn)展

    廣和通側(cè)AI解決方案驅(qū)動(dòng)性能密集型場(chǎng)景商用型場(chǎng)景商用

    2024世界機(jī)器人大會(huì)期間,廣和通宣布:基于高通QCS8550平臺(tái)的廣和通側(cè)AI解決方案高效使能性能密集型場(chǎng)景。該
    的頭像 發(fā)表于 08-23 16:06 ?248次閱讀

    廣和通側(cè)AI解決方案驅(qū)動(dòng)性能密集型場(chǎng)景商用型場(chǎng)景商用

    2024世界機(jī)器人大會(huì)期間,廣和通宣布:基于高通QCS8550平臺(tái)的廣和通側(cè)AI解決方案高效使能性能密集型場(chǎng)景。該
    的頭像 發(fā)表于 08-23 16:05 ?610次閱讀
    廣和通<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>解決方案驅(qū)動(dòng)性能密集型場(chǎng)景商用型場(chǎng)景商用

    能效比較GPGPU高一個(gè)數(shù)量級(jí),國產(chǎn)AI芯片讓側(cè)AI大模型高質(zhì)量落地

    電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)2024年世界人工智能大會(huì)(以下簡(jiǎn)稱:WAIC 2024)依然是一場(chǎng)“百模大戰(zhàn)”,不過有一些很明顯的變化是:新推出的AI大模型更加注重用戶體驗(yàn);邊側(cè)
    的頭像 發(fā)表于 07-10 16:28 ?1755次閱讀
    能效比較GPGPU高一個(gè)數(shù)量級(jí),國產(chǎn)<b class='flag-5'>AI</b>芯片讓<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>大模型高質(zhì)量落地

    MWCS 2024 | 廣和通榮獲邊緣AI計(jì)算最佳創(chuàng)新方案

    2024世界移動(dòng)通信大會(huì)·上海(MWCS 2024)期間,廣和通側(cè)AI解決方案憑借卓越特性與極具潛力的商業(yè)價(jià)值斬獲
    的頭像 發(fā)表于 06-28 18:22 ?273次閱讀
    MWCS <b class='flag-5'>2024</b> | 廣和通榮獲邊緣<b class='flag-5'>AI</b>計(jì)算最佳創(chuàng)新方案

    MWCS 2024 廣和通榮獲邊緣AI計(jì)算最佳創(chuàng)新方案

    2024世界移動(dòng)通信大會(huì)·上海(MWCS 2024)期間,廣和通側(cè)AI解決方案憑借卓越特性與極具潛力的商業(yè)價(jià)值斬獲
    的頭像 發(fā)表于 06-28 18:21 ?806次閱讀
    MWCS <b class='flag-5'>2024</b>  廣和通榮獲邊緣<b class='flag-5'>AI</b>計(jì)算最佳創(chuàng)新方案

    廣和通側(cè)AI解決方案榮膺M(jìn)WCS 2024邊緣AI計(jì)算最佳創(chuàng)新獎(jiǎng)

    在近日舉行的2024世界移動(dòng)通信大會(huì)·上海(MWCS 2024)上,廣和通憑借其卓越的側(cè)AI解決方案榮獲
    的頭像 發(fā)表于 06-28 15:44 ?689次閱讀

    廣和通發(fā)布基于高通 QCM6490和QCS8550處理器的側(cè)AI解決方案

    6月7日,COMPUTEX 2024(臺(tái)北國際電腦展2024)期間,為拓展物聯(lián)網(wǎng)生態(tài)系統(tǒng)并滿足側(cè)AI應(yīng)用需求,廣和通發(fā)布基于高通 QCM6
    的頭像 發(fā)表于 06-07 16:44 ?886次閱讀

    廣和通發(fā)布基于高通QCM6490和QCS8550的側(cè)AI解決方案,使AI“更接地氣”

    6月7日,COMPUTEX 2024期間,為拓展物聯(lián)網(wǎng)生態(tài)系統(tǒng)并滿足側(cè)AI應(yīng)用需求,廣和通發(fā)布基于高通? QCM6490和QCS8550處理器的
    的頭像 發(fā)表于 06-07 16:36 ?352次閱讀

    廣和通發(fā)布基于高通QCM6490和QCS8550的側(cè)AI解決方案,使AI“更接地氣”

    6月7日,COMPUTEX 2024期間,為拓展物聯(lián)網(wǎng)生態(tài)系統(tǒng)并滿足側(cè)AI應(yīng)用需求,廣和通發(fā)布基于高通? QCM6490和QCS8550處理器的
    的頭像 發(fā)表于 06-07 16:30 ?757次閱讀
    廣和通發(fā)布基于高通QCM6490和QCS8550的<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>解決方案,使<b class='flag-5'>AI</b>“更接地氣”

    廣和通發(fā)布高性能側(cè)AI解決方案,賦能物聯(lián)網(wǎng)生態(tài)系統(tǒng)

    在近日盛大開幕的COMPUTEX 2024(臺(tái)北國際電腦展2024)上,廣和通憑借其前瞻性的技術(shù)視野,發(fā)布了一款基于高通? QCM6490和QCS8550處理器的側(cè)
    的頭像 發(fā)表于 06-07 16:15 ?573次閱讀

    榮耀引領(lǐng)側(cè)AI新時(shí)代

    在今年的MWC盛會(huì)上,榮耀宣布與高通、Meta攜手,將70億參數(shù)大模型引入側(cè),這一創(chuàng)新舉措預(yù)示著側(cè)AI新時(shí)代的到來。榮耀終端CEO趙明在
    的頭像 發(fā)表于 03-01 10:28 ?565次閱讀