0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

【AI簡(jiǎn)報(bào)20221021期】英特爾i9-13900K重奪PC性能桂冠、RISC-V可靠矢量處理彎道超車

RTThread物聯(lián)網(wǎng)操作系統(tǒng) ? 來(lái)源:未知 ? 2022-11-10 11:00 ? 次閱讀

嵌入式 AI

AI 簡(jiǎn)報(bào) 20221021 期

1. 英特爾i9-13900K重奪PC性能桂冠:與AMD 7950X拉開8%差距

原文:

https://app.myzaker.com/news/article.php?pk=63476be18e9f0903ac797c80

10 月 20 日晚上,英特爾正式解禁了 13 代酷睿臺(tái)式機(jī)處理器的性能表現(xiàn),包括 Intel Core i9-13900K 和 i5-13600K。美國(guó)科技媒體 The Verge 對(duì) i9-13900K 與 AMD Ryzen 9 7950X 進(jìn)行了比較 ,發(fā)現(xiàn)雖然 AMD 的 Zen 4 架構(gòu) CPU 相較于英特爾 12 代酷睿的性能有所提升,但這次英特爾 13 代酷睿重新奪回了整體性能的桂冠。

先來(lái)看下英特爾酷睿 i9-13900K 的相關(guān)參數(shù),作為高端版本,它包括 24 個(gè)核心(8 個(gè)性能核和 16 個(gè)效能核)、32 個(gè)線程和高達(dá) 5.8GHz 的時(shí)鐘速度。

英特爾承諾,酷睿 i9-13900K 的單線程性能較 i9-12900K 提升了 15%,多線程性能提升了 41%。與此同時(shí),它的售價(jià)也來(lái)到了 589 美元。

過(guò)去一周,The Verge 一直在測(cè)試酷睿 i9-13900K,它在很大程度上兌現(xiàn)了英特爾聲稱的性能,尤其是多線程性能大幅提升,真正加速了最繁重的工作負(fù)載效率。

具體地,The Verge 在英特爾酷睿 i9-13900K 和 AMD 銳龍 9 7950X 處理器上測(cè)試了各種工作負(fù)載、綜合基礎(chǔ)測(cè)試和游戲。所有的測(cè)試均在最新的 Windows 11 2022 Update 上運(yùn)行,并關(guān)閉了安全性,啟用了 Resizable BAR,所有游戲都在 1080p 分辨率設(shè)置下運(yùn)行。

fa799db2-5155-11ed-a3b6-dac502259ad0.png

2. 谷歌3D全息電話亭,顛覆現(xiàn)有視頻通話!宛如真人面對(duì)面

原文:

https://mp.weixin.qq.com/s/TMhMjFZbw96n4CUkVQ_z1w

在近日的Google Cloud Next 2022上,桑達(dá)爾·皮查伊表示,Starline 項(xiàng)目已經(jīng)在谷歌內(nèi)部進(jìn)行了數(shù)千小時(shí)的測(cè)試,并在其美國(guó)辦公室每天使用,而100多個(gè)橫跨媒體、醫(yī)療和零售的企業(yè)合作伙伴已經(jīng)收到了演示。

谷歌還宣布Project Starline正在進(jìn)入下一個(gè)測(cè)試階段,計(jì)劃是在選定的合作伙伴辦公室部署設(shè)備進(jìn)行定期測(cè)試,谷歌提到的合作伙伴包括Salesforce、WeWork、T-Mobile和Hackensack Meridian Health,這些設(shè)備預(yù)計(jì)將在今年年底前完成安裝,開啟初試。

谷歌為什么花費(fèi)大量時(shí)間開展Project Starline呢?根據(jù)項(xiàng)目組給出的答案,就是讓人在通話的時(shí)候,感覺你是和一個(gè)真正的人在一起。在如今的社會(huì)中,人們通常會(huì)相隔千里,尤其是近兩年疫情頻繁發(fā)生,人們不得不通過(guò)Zoom等遠(yuǎn)程會(huì)議軟件,進(jìn)行聯(lián)系、溝通工作。

然而當(dāng)下視頻會(huì)議給人的感覺并不好,根據(jù)微軟一份關(guān)于視頻會(huì)議對(duì)工作效率的影響的報(bào)告,人們?cè)谝曨l會(huì)議中會(huì)比顯示溝通更容易分析,這是人們?cè)诿鎸?duì)高壓力的視頻會(huì)議下的自然應(yīng)對(duì)反應(yīng)。而谷歌認(rèn)為,能提供真人對(duì)話體驗(yàn)的Project Starline,似乎能夠消除這種壓力感。

谷歌的研究員做了對(duì)比實(shí)驗(yàn),他們發(fā)現(xiàn)相比傳統(tǒng)視頻溝通,使用Project Starline溝通的參會(huì)者會(huì)有更多眼神接觸和肢體語(yǔ)言,在溝通結(jié)束后能夠回憶的內(nèi)容也要多出28%。

fab4da12-5155-11ed-a3b6-dac502259ad0.jpg

更為重要的是,裝配一套Project Starline,成本相當(dāng)高,光場(chǎng)顯示器和各種光學(xué)攝像頭都非常昂貴,這使得Project Starline短期內(nèi)只能停留在實(shí)驗(yàn)室,而進(jìn)入消費(fèi)者市場(chǎng)的可能性很小。Project Starline的產(chǎn)品管理總監(jiān)Andrew Nartker稱,目前它還很難稱得上是一件產(chǎn)品。

整體而言,Project Starline是一個(gè)全新技術(shù)的探索,谷歌也會(huì)繼續(xù)對(duì)其進(jìn)行優(yōu)化改進(jìn)。未來(lái),它能否成為一個(gè)真正的產(chǎn)品還未可知。不過(guò)無(wú)論怎樣,任何一項(xiàng)新技術(shù)的探索都值得被關(guān)注。

3. 通用計(jì)算仍有差距,RISC-V可靠矢量處理彎道超車

原文:

https://mp.weixin.qq.com/s/mM9Drv8r2QGSD7Hm8i8HWA

對(duì)于高效的數(shù)據(jù)并行負(fù)載處理來(lái)說(shuō),矢量架構(gòu)的吸引力越來(lái)越大,主流ISA都開始注意到這一點(diǎn)。就拿我們熟悉的前超算王者——日本的富岳來(lái)說(shuō),其處理器富士通A64FX就是基于Arm可伸縮矢量擴(kuò)展(SVE)的。

Arm也在隨后推出的Armv9架構(gòu)中提出了改良版的SVE2,并在其中加入了對(duì)NEON的兼容,SVE2在HPC之外的市場(chǎng)應(yīng)用中做出了指令優(yōu)化,甚至可以用于手機(jī)、汽車等智能設(shè)備中。

正是因?yàn)橛辛薙VE的存在,富岳才得以單靠通用處理器完成高性能的大數(shù)據(jù)運(yùn)算,而不是像其他主流超算一樣,還要靠堆積GPUFPGA和AI加速器等片外加速器才能實(shí)現(xiàn)可觀的性能,我國(guó)的神威太湖之光同樣運(yùn)用了這樣的矢量設(shè)計(jì)思路。但以上這些都是專有架構(gòu),微架構(gòu)不透明的同時(shí)也限制了開源和定制化方案的出現(xiàn),而這些均可以在RISC-V上一一實(shí)現(xiàn)。

RISC-V的矢量擴(kuò)展RVV自2015年提出以來(lái),已經(jīng)有了長(zhǎng)足的進(jìn)展,也有了正式的1.0版本規(guī)范。與傳統(tǒng)的SIMD指令相比,RVV提供動(dòng)態(tài)的矢量長(zhǎng)度修改,做到了更高的效率、更小的代碼體積和更簡(jiǎn)單的循環(huán)結(jié)束。我們近期已經(jīng)看到了不少RISC-V處理器被廣泛使用的新聞,比如谷歌選擇在其TPU上加入SiFive的X280處理器,其實(shí)看重的就是它在矢量處理上的優(yōu)勢(shì)。

所以我們看到在SiFive的處理器產(chǎn)品中,像Performance P270和Intelligence X280都擁有優(yōu)秀的矢量處理能力,后者更是引入了一個(gè)512位矢量寄存器長(zhǎng)度的架構(gòu),在完全支持矢量擴(kuò)展標(biāo)準(zhǔn)的同時(shí),還支持動(dòng)態(tài)可變矢量長(zhǎng)度的運(yùn)算。SiFive也在其矢量擴(kuò)展上做出了改進(jìn),稱其為SiFive智能擴(kuò)展,與直接基于RV64GCV架構(gòu)的設(shè)計(jì)相比,X280的智能擴(kuò)展在INT8格式下的矩陣乘法運(yùn)算時(shí)可將執(zhí)行速度提高12倍。

而且這不僅僅造福的是數(shù)據(jù)中心,還有受制于功耗卻又需要高吞吐量和單線程性能的邊緣應(yīng)用,比如AR/VR、數(shù)碼相機(jī)等等。SiFive同樣測(cè)試了可用于移動(dòng)端或嵌入式設(shè)備的輕量級(jí)神經(jīng)網(wǎng)絡(luò)MobileNet,相較基于RISC-V標(biāo)量的架構(gòu),SiFive智能擴(kuò)展可以將速度提升144倍。

fad544aa-5155-11ed-a3b6-dac502259ad0.png

AI時(shí)代下,矢量處理的應(yīng)用場(chǎng)景已經(jīng)遠(yuǎn)超我們的現(xiàn)象,包括深度學(xué)習(xí)、推薦系統(tǒng)、鍵值存儲(chǔ)和HPC等,都已經(jīng)廣泛利用了矢量計(jì)算。但如何做到高效高性能,才是未來(lái)所有ISA的努力方向,而RISC-V作為后來(lái)者,反而能在這上面找到彎道超車的機(jī)會(huì)。

4. 移動(dòng)端部署推薦系統(tǒng):快手獲數(shù)據(jù)挖掘頂會(huì)CIKM 2022最佳論文

原文:

https://mp.weixin.qq.com/s/x3dnkBF7BKDMEU_rt8QmDg

10 月 20 日,信息檢索和數(shù)據(jù)挖掘領(lǐng)域的頂級(jí)會(huì)議之一 CIKM 2022 公布論文獎(jiǎng)項(xiàng),快手社區(qū)科學(xué)團(tuán)隊(duì)獲得了應(yīng)用研究方向「最佳論文獎(jiǎng)」。

fb227b44-5155-11ed-a3b6-dac502259ad0.jpg

獲獎(jiǎng)?wù)撐摹禦eal-time Short Video Recommendation on Mobile Devices》針對(duì)短視頻推薦場(chǎng)景,傳統(tǒng)服務(wù)端部署的推薦系統(tǒng)在決策時(shí)機(jī)和實(shí)時(shí)特征利用方面的不足問(wèn)題,通過(guò)在移動(dòng)客戶端部署推薦系統(tǒng)來(lái)實(shí)時(shí)響應(yīng)用戶反饋,提高推薦結(jié)果的精準(zhǔn)度,從而提升用戶體驗(yàn)。論文提出的方案 100% 流量部署到了快手短視頻推薦生產(chǎn)環(huán)境,影響了日均超過(guò) 3.4 億用戶的體驗(yàn),是端上智能在大規(guī)模推薦場(chǎng)景落地的創(chuàng)新實(shí)踐。

fb476a3a-5155-11ed-a3b6-dac502259ad0.jpg

論文鏈接:

https://dl.acm.org/doi/10.1145/3511808.3557065

5. 致敬Metaformer!圖像超分多尺度注意網(wǎng)絡(luò)MAN開源:大核分解與注意力機(jī)制的巧妙結(jié)合

原文:

https://mp.weixin.qq.com/s/DF73mR6U4MstHeAHOZTGBw

論文鏈接:

https://arxiv.org/abs/2209.14145

代碼地址:

https://github.com/icandle/MAN

本文基于大核分解和注意機(jī)制,提出應(yīng)用于圖像超分的多尺度注意網(wǎng)絡(luò)MAN。通過(guò)可解釋的門控空間注意單元來(lái)匯總上下文信息,利用多尺度大核注意模塊獲得豐富注意特征圖,并聚合局部-全局信息。本文方法與現(xiàn)有流行方法進(jìn)行了詳細(xì)的實(shí)驗(yàn)對(duì)比,獲得了競(jìng)爭(zhēng)性的對(duì)比結(jié)果。

fb8beeda-5155-11ed-a3b6-dac502259ad0.jpg

圖像超分旨在從低分辨率輸入重建高分辨輸出。然而基于CNN的方法要么通過(guò)更大數(shù)據(jù)集來(lái)提高性能,要么引入了更復(fù)雜的網(wǎng)絡(luò)設(shè)計(jì),這些無(wú)疑都增加了計(jì)算成本消耗。

還記得今年2月份出爐的那篇VAN嗎,VAN通過(guò)詳細(xì)實(shí)驗(yàn)證明了大核的卷積可以被有效分解為三種卷積的組合,分別為:深度卷積、含膨脹的深度卷積、逐點(diǎn)卷積。這里給出VAN的分解示意圖:

fba00924-5155-11ed-a3b6-dac502259ad0.jpg

VAN的作者在文末提到,未來(lái)對(duì)VAN的改進(jìn)可能包含多分支或多尺度設(shè)計(jì)的應(yīng)用。在本文中,作者等人在圖像超分任務(wù)中對(duì)VAN進(jìn)行可行性考察,發(fā)現(xiàn)了一個(gè)很重要的問(wèn)題:VAN的分解過(guò)程中,含膨脹的深度卷積會(huì)為超分任務(wù)帶來(lái)“塊狀偽影(blocking artifacts)”。在損害性能的同時(shí),固定的核大小無(wú)法充分局部-全局特征。

綜上,作者將多尺度機(jī)制與大核注意機(jī)制結(jié)合來(lái)解決上述問(wèn)題,并采用門控機(jī)制校準(zhǔn)注意圖,避免含膨脹的深度卷積帶來(lái)的塊狀偽影。

6. 一個(gè)Trick 搞定 CNN與Transformer,即插即漲點(diǎn)即提速

原文:

https://mp.weixin.qq.com/s/jRfWEgQ6cqVz5hcm6WOa2g

論文鏈接:

https://arxiv.org/abs/2210.04020

近年來(lái),Transformer模型在各個(gè)領(lǐng)域都取得了巨大的進(jìn)展。在計(jì)算機(jī)視覺領(lǐng)域,視覺TransformerViTs)也成為卷積神經(jīng)網(wǎng)絡(luò)ConvNets)的有力替代品,但它們還無(wú)法取代ConvNet,因?yàn)閮烧叨加懈髯缘膬?yōu)點(diǎn)。例如,ViT善于利用注意力機(jī)制提取全局特征,而ConvNets由于其強(qiáng)烈的歸納偏差,在建模局部關(guān)系時(shí)更有效。

fbc744a8-5155-11ed-a3b6-dac502259ad0.jpg

一個(gè)自然的想法是結(jié)合ConvNetsViT的優(yōu)勢(shì)來(lái)設(shè)計(jì)新的結(jié)構(gòu)。本文提出了一種新的基本神經(jīng)網(wǎng)絡(luò)算子,稱為位置感知循環(huán)卷積(ParC)及其加速版本Fast-ParC。ParC算子通過(guò)使用全局核和循環(huán)卷積來(lái)捕獲全局特征,同時(shí)通過(guò)位置嵌入來(lái)保持位置敏感性。

Fast-ParC使用快速傅里葉變換將ParC的O(n2)時(shí)間復(fù)雜度進(jìn)一步降低為O(n log n)。這種加速使得在具有大型特征映射的模型的早期階段使用全局卷積成為可能,但仍保持與使用3x3或7x7內(nèi)核相當(dāng)?shù)目傮w計(jì)算成本。所提出的操作可以以即插即用的方式使用:

1)將ViT轉(zhuǎn)換為純ConvNet架構(gòu),以獲得更廣泛的硬件支持和更高的推理速度;

2)在ConvNets的深層替換傳統(tǒng)的卷積,通過(guò)擴(kuò)大有效感受野來(lái)提高準(zhǔn)確性。實(shí)驗(yàn)結(jié)果表明,ParC操作可以有效地?cái)U(kuò)大傳統(tǒng)ConvNets的感受野,并且在所有三種流行的視覺任務(wù)(圖像分類、目標(biāo)檢測(cè)和語(yǔ)義分割)中,采用所提出的操作都有利于ViTConvNet模型。

fbe90dea-5155-11ed-a3b6-dac502259ad0.jpg

7. 只需一次向前推導(dǎo),深度神經(jīng)網(wǎng)絡(luò)可視化方法來(lái)了!

原文:

https://mp.weixin.qq.com/s/rzle3EYD4atj9oJ0Xy43aw

論文地址:

https://arxiv.org/abs/2209.11189

fc388e92-5155-11ed-a3b6-dac502259ad0.png

寫在前面的話

類激活圖(CAM)致力于解釋卷積神經(jīng)網(wǎng)絡(luò)的“黑盒”屬性。本文首次提出可學(xué)習(xí)的類激活方法,通過(guò)設(shè)計(jì)適當(dāng)損失來(lái)迫使注意機(jī)制學(xué)習(xí)有效CAM輸出,并只需一次前向推理。在ImageNet上與流行類激活方法比較,取得了優(yōu)異且有趣的實(shí)驗(yàn)結(jié)果。最后針對(duì)分類錯(cuò)誤的情況,作者等人進(jìn)行了細(xì)致而全面的分析。

類激活方法與Motivation簡(jiǎn)述

深度卷積神經(jīng)網(wǎng)絡(luò)對(duì)相關(guān)決策的可解釋性不強(qiáng),這種“黑盒”屬性影響了該技術(shù)在安全、醫(yī)療等領(lǐng)域的商業(yè)應(yīng)用。由類激活圖(CAM)生成的顯著圖SM(saliency map)描述了對(duì)模型決策貢獻(xiàn)最大的圖像區(qū)域,因此是一種為“黑盒”提供可解釋理論的方法。

以往的CAM方法分為基于梯度基于擾動(dòng)兩種,如下圖所示:

fc5e4ccc-5155-11ed-a3b6-dac502259ad0.jpg

在圖1 (a) 中,基于梯度的方法使用從outputs反向傳播的梯度計(jì)算最后一個(gè)卷積層中特征權(quán)重,并將特征圖加權(quán)聚合得到CAM,explanation代表由CAM產(chǎn)生的SM。(常見的有Grad-CAM、GradCAM++)

在圖1 (b) 中,基于擾動(dòng)的方法通常選取模型中不同深度的特征圖,或隨機(jī)擾動(dòng)圖(圖1 (c) ),作為掩碼與輸入圖像點(diǎn)乘,得到擾動(dòng)輸入,最后通過(guò)前向傳遞擾動(dòng)輸入來(lái)生成SM。(常見方法有SIDU、Score-CAM、SISE、ADA-SISE、RISE)

然而這些方法要么基于反向傳播梯度,要么在推理階段需要多次前向傳遞,因此引入了大量的計(jì)算開銷。另外,這些方法在關(guān)注模型解釋的同時(shí),忽略了對(duì)訓(xùn)練集的有效利用。

因此本文提出了一種僅需一次前向傳遞的方法,同時(shí)引入注意機(jī)制,用可學(xué)習(xí)的方法,使訓(xùn)練集得到了充分利用。

一些可能的思考與總結(jié)

本文為進(jìn)一步解釋“黑盒”模型,提出了一種可學(xué)習(xí)的CAM方法,并產(chǎn)生了具有競(jìng)爭(zhēng)性的實(shí)驗(yàn)結(jié)果。但是有兩個(gè)問(wèn)題筆者不得其解。

第一個(gè)問(wèn)題就是,本文方法通過(guò)訓(xùn)練集大量訓(xùn)練獲得四個(gè)經(jīng)驗(yàn)下的正則化參數(shù),那么相比其他方法,是否存在額外增加了實(shí)現(xiàn)成本?另外,如果將此參數(shù)應(yīng)用于其他數(shù)據(jù)集上是否能保持原有性能,到時(shí)候如果不能是不是又要重新從訓(xùn)練集中獲取呢?

第二,對(duì)于ImageNet中的某些包含多標(biāo)簽圖像,錯(cuò)誤分類的原因是分類器已經(jīng)對(duì)某些類別形成既定的學(xué)習(xí)認(rèn)知。那么假如沒有訓(xùn)練這個(gè)環(huán)節(jié),是不是就能減少對(duì)某些已確定類別的錯(cuò)誤識(shí)別呢,或者說(shuō),有沒有其他方法能減少這種情況的發(fā)生呢。

8. AI框架歷史演進(jìn)和趨勢(shì)探索

原文:

https://mp.weixin.qq.com/s/a3GaHwBNq7KJO0Dex-xOUg

AI框架是一種底層開發(fā)工具,是集深度學(xué)習(xí)核心訓(xùn)練和推理框架、基礎(chǔ)模型庫(kù)、端到端開發(fā)套件、豐富的工具組件于一體的平臺(tái)。

有了AI框架,工程師在工作時(shí)調(diào)試算法,就可以更快速、更高效。通俗一點(diǎn)講,AI框架相當(dāng)于是AI時(shí)代的操作系統(tǒng),如同PC時(shí)代Windows,移動(dòng)互聯(lián)網(wǎng)時(shí)代的iOS和安卓。

AI框架發(fā)展現(xiàn)狀和趨勢(shì)

AI框架的歷史并不算長(zhǎng),從2010年誕生的Theano算起,至今不過(guò)十二年時(shí)間。2017年后,早期的Theano、Caffe、Torch等框架逐漸銷聲匿跡,2016年前后出現(xiàn)的TensorFlow(谷歌)、PyTorch(Facebook)、飛槳(百度)逐漸占據(jù)市場(chǎng)。

從目前市場(chǎng)占有情況看,產(chǎn)業(yè)界以TensorFlow為主,學(xué)術(shù)界以PyTorch為主。與TensorFlow過(guò)于注重工業(yè),PyTorch專注學(xué)界不同,飛槳的特性在于工業(yè)學(xué)界兩手抓,通過(guò)動(dòng)態(tài)圖自動(dòng)解析編譯靜態(tài)圖的技術(shù),兼顧了學(xué)界的靈活,同時(shí)也實(shí)現(xiàn)了產(chǎn)業(yè)界希望的高效。

除了TensorFlow、PyTorch、飛槳,深度學(xué)習(xí)框架還包括由Amazon設(shè)計(jì)研發(fā)并開源的MXNet、微軟在github上開源的CNTK、華為推出的MindSpore、北京一流科技有限公司開發(fā)的OneFlow,以及清華大學(xué)自研的Jittor,和騰訊、字節(jié)跳動(dòng)、360開源的Angel、BytePS、TensorNet。

過(guò)去這些年,AI框架已形成較為完整的技術(shù)體系,當(dāng)前主流AI框架的核心技術(shù)演化出三大層次,分為基礎(chǔ)層、組件層和生態(tài)層,其中基礎(chǔ)層實(shí)現(xiàn)AI框架最基礎(chǔ)核心的功能,具體包括編程開發(fā)、編譯優(yōu)化以及硬件使能三個(gè)子層。

從技術(shù)生態(tài)體系中的功能定位看,AI框架對(duì)下調(diào)用底層硬件計(jì)算資源,對(duì)上支撐AI應(yīng)用算法模型搭建,提供算法工程化實(shí)現(xiàn)的標(biāo)準(zhǔn)環(huán)境,是AI技術(shù)體系的關(guān)鍵核心。

AI框架技術(shù)持續(xù)演進(jìn),歷經(jīng)萌芽階段、成長(zhǎng)階段、穩(wěn)定階段,當(dāng)前已進(jìn)入深化階段。AI框架正向著超大規(guī)模AI、全場(chǎng)景支持、安全可信等技術(shù)特性深化探索。

AI框架面臨的挑戰(zhàn)

然而在這個(gè)探索的過(guò)程中,面臨諸多挑戰(zhàn)。在超大規(guī)模AI方面,當(dāng)前超大規(guī)模AI成為新的深度學(xué)習(xí)范式。OpenAI于2020年5月發(fā)布GPT-3模型,包含1750億參數(shù),數(shù)據(jù)集達(dá)到45T,在多項(xiàng)NLP任務(wù)中超越了人類水平。這種超大規(guī)模的模型參數(shù)及超大規(guī)模的數(shù)據(jù)集的AI大模型范式,實(shí)現(xiàn)了深度學(xué)習(xí)新的突破。

產(chǎn)業(yè)界和學(xué)術(shù)界看到這種新型范式的潛力后紛紛入局,繼OpenAI后,華為基于MindSpore框架發(fā)布了盤古大模型、智源發(fā)布了悟道模型、阿里發(fā)布了M6模型、百度發(fā)布了文心模型等。超大規(guī)模AI正成為下一代人工智能的突破口,也是最有潛力的強(qiáng)人工智能技術(shù)。

超大規(guī)模AI需要大模型、大數(shù)據(jù)、大算力的三重支持,這就對(duì)AI框架提出了新的挑戰(zhàn),比如內(nèi)存墻,大模型訓(xùn)練過(guò)程中需要存儲(chǔ)參數(shù)、激活、梯度、優(yōu)化器狀態(tài),鵬程 盤古一個(gè)模型的訓(xùn)練就需要近4TB的內(nèi)存。算力墻,以鵬程 . 盤古2000億參數(shù)量的大模型為例,需要3.6EFLOPS的算力支持,要求必須構(gòu)建大規(guī)模的異構(gòu)AI計(jì)算集群才能滿足這樣的算力需求,同時(shí)算力平臺(tái)要滿足智能調(diào)度來(lái)提升算力資源的利用率。還有通信墻、調(diào)優(yōu)墻、部署墻等。

在全場(chǎng)景支持方面,隨著云服務(wù)器、邊緣設(shè)備、終端設(shè)備等人工智能硬件運(yùn)算設(shè)備的不斷涌現(xiàn),以及各類人工智能運(yùn)算庫(kù)、中間表示工具以及編程框架的快速發(fā)展,人工智能軟硬件生態(tài)呈現(xiàn)多樣化發(fā)展趨勢(shì)。但主流框架訓(xùn)練出來(lái)的模型卻不能通用,學(xué)術(shù)科研項(xiàng)目間難以合作延伸,造成了深度學(xué)習(xí)框架的“碎片化”。

目前業(yè)界并沒有統(tǒng)一的中間表示層標(biāo)準(zhǔn),導(dǎo)致各硬件廠商解決方案存在一定差異,以致應(yīng)用模型遷移不暢,增加了應(yīng)用部署難度。因此,基于AI框架訓(xùn)練出來(lái)的模型進(jìn)行標(biāo)準(zhǔn)化互通將是未來(lái)的挑戰(zhàn)。

然而即使面臨諸多挑戰(zhàn),過(guò)去兩年,行業(yè)一直在持續(xù)探索,并取得一定突破,如2020年華為推出昇思MindSpore,在全場(chǎng)景協(xié)同、可信賴方面有一定的突破;曠視推出天元MegEngine,在訓(xùn)練推理一體化方面深度布局等。

整體而言,在人工智能體系中,AI框架處于貫通上下的腰部位置,下接芯片、上承應(yīng)用,是一個(gè)關(guān)鍵樞紐,是推動(dòng)AI應(yīng)用大規(guī)模落地的關(guān)鍵力量。因此對(duì)于企業(yè)來(lái)說(shuō),克服AI框架當(dāng)前面臨的挑戰(zhàn),不斷探索新趨勢(shì),進(jìn)行技術(shù)創(chuàng)新,完善技術(shù)、功能和生態(tài)是關(guān)鍵。

- END -

fc82f36a-5155-11ed-a3b6-dac502259ad0.gif


原文標(biāo)題:【AI簡(jiǎn)報(bào)20221021期】英特爾i9-13900K重奪PC性能桂冠、RISC-V可靠矢量處理彎道超車

文章出處:【微信公眾號(hào):RTThread物聯(lián)網(wǎng)操作系統(tǒng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • RT-Thread
    +關(guān)注

    關(guān)注

    31

    文章

    1239

    瀏覽量

    39426

原文標(biāo)題:【AI簡(jiǎn)報(bào)20221021期】英特爾i9-13900K重奪PC性能桂冠、RISC-V可靠矢量處理彎道超車

文章出處:【微信號(hào):RTThread,微信公眾號(hào):RTThread物聯(lián)網(wǎng)操作系統(tǒng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    高通Copilot+ PC獨(dú)占將盡,英特爾與AMD筆記本11月迎AI新紀(jì)元

    科技界迎來(lái)新動(dòng)態(tài),據(jù)知名科技媒體Engadget 9月4日?qǐng)?bào)道,高通此前獨(dú)享的Copilot+ PC技術(shù)即將迎來(lái)其獨(dú)家授權(quán)的尾聲。從今年11月起,搭載英特爾最新酷睿Ultra 200
    的頭像 發(fā)表于 09-04 15:43 ?523次閱讀

    risc-v多核芯片在AI方面的應(yīng)用

    RISC-V多核芯片能夠更好地適應(yīng)AI算法的不同需求,包括深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等,從而提高芯片的性能和效率,降低成本,使AI邊緣計(jì)算晶片更具競(jìng)爭(zhēng)力。 再者,
    發(fā)表于 04-28 09:20

    AI PC市場(chǎng)爭(zhēng)霸:英特爾、AMD、高通芯片算力誰(shuí)主沉???

    目前英特爾的Meteor Lake處理器NPU只能提供10 TOPS的性能,沒有達(dá)到下一代AI PC的標(biāo)準(zhǔn)。而 Lunar Lake 的 N
    發(fā)表于 04-18 14:29 ?310次閱讀

    英特爾澎湃動(dòng)力驅(qū)動(dòng)商用AI PC,打造AI+時(shí)代的新質(zhì)生產(chǎn)工具

    近日,英特爾舉辦了“2024全新英特爾商用客戶端AI PC產(chǎn)品發(fā)布會(huì)”,將基于英特爾酷睿Ultra處理
    的頭像 發(fā)表于 04-02 10:12 ?364次閱讀

    英特爾酷睿Ultra通過(guò)全新英特爾vPro平臺(tái)將AI PC惠及企業(yè)

    近日,英特爾在2024年世界移動(dòng)通信大會(huì)(MWC 2024)上宣布,全新英特爾?vPro?平臺(tái)將AI PC的優(yōu)勢(shì)惠及商用客戶。
    的頭像 發(fā)表于 03-18 15:07 ?392次閱讀

    英特爾推出全新vPro平臺(tái),將AI PC的優(yōu)勢(shì)延伸至商用領(lǐng)域

    在2024年世界移動(dòng)通信大會(huì)(MWC 2024)上,英特爾宣布了其全新英特爾?vPro?平臺(tái)的發(fā)布,旨在將AI PC的先進(jìn)功能帶給商用客戶。這一平臺(tái)結(jié)合了內(nèi)置
    的頭像 發(fā)表于 03-03 15:47 ?965次閱讀

    英特爾:2025年將為1億AI PC提供核心處理

    英特爾客戶端計(jì)算部門副總David Feng指出,預(yù)計(jì)今年供應(yīng)4000萬(wàn)臺(tái)AI PC芯片,并于2025年底增加至6000萬(wàn)臺(tái),即占據(jù)2025年全球個(gè)人電腦市場(chǎng)預(yù)計(jì)總量的20%以上。在AI
    的頭像 發(fā)表于 02-29 09:43 ?478次閱讀

    英特爾vPro讓AI PC造福企業(yè)

    全新vPro平臺(tái)為各種規(guī)模的企業(yè)提供出色的生產(chǎn)力、安全性、可管理性和穩(wěn)定性 最新消息:今天,英特爾在2024年世界移動(dòng)通信大會(huì)(MWC 2024)上宣布,全新英特爾??vPro?平臺(tái)將AI P
    的頭像 發(fā)表于 02-28 16:01 ?276次閱讀

    開啟AI PC新紀(jì)元!英特爾酷睿Ultra重磅發(fā)布,勝任200億參數(shù)大語(yǔ)言模型

    出色的計(jì)算和圖形性能以及非凡的AI PC體驗(yàn),英特爾宣布將與主流OEM伙伴推出230余款機(jī)型,開啟AI
    的頭像 發(fā)表于 12-16 15:14 ?2107次閱讀
    開啟<b class='flag-5'>AI</b> <b class='flag-5'>PC</b>新紀(jì)元!<b class='flag-5'>英特爾</b>酷睿Ultra重磅發(fā)布,勝任200億參數(shù)大語(yǔ)言模型

    英特爾處理器,掀AI PC戰(zhàn)火

    隨著ai時(shí)代的到來(lái),英特爾正在構(gòu)想新的酷睿Ultra處理器(代號(hào)Meteor Lake),這是英特爾的第一個(gè)基于npu的處理器,旨在在
    的頭像 發(fā)表于 12-11 11:26 ?815次閱讀

    RISC-V內(nèi)核突破百億顆 RVV1.0如何解鎖端側(cè)AI市場(chǎng)應(yīng)用潛能

    ”(南湖)開源高性能RISC-V處理器內(nèi)核,其性能已超過(guò)ARM A76;阿里平頭哥發(fā)布的首個(gè)自研RISC-V
    發(fā)表于 12-01 13:17

    英特爾發(fā)布面向發(fā)燒友的英特爾酷睿第14代臺(tái)式機(jī)處理

    ,由于比前一代增加了4個(gè)能效核,i7-14700K擁有20核心和28線程。英特爾Extreme Tuning Utility新增了AI Assist功能,為特定的未鎖頻臺(tái)式機(jī)處理器帶來(lái)
    的頭像 發(fā)表于 10-21 16:40 ?691次閱讀

    英特爾啟動(dòng)首個(gè)AI PC加速計(jì)劃

    AI PC加速計(jì)劃將為軟件合作伙伴提供工程軟件和資源,以在2025年前實(shí)現(xiàn)為超過(guò)1億臺(tái)PC實(shí)現(xiàn)人工智能特性。 新聞亮點(diǎn) 英特爾AI
    的頭像 發(fā)表于 10-21 16:40 ?454次閱讀
    <b class='flag-5'>英特爾</b>啟動(dòng)首個(gè)<b class='flag-5'>AI</b> <b class='flag-5'>PC</b>加速計(jì)劃

    i9-14900K/i7-14700K處理器首發(fā)評(píng)測(cè)

    頻率從5.4GHz提高到5.6GHz,全核頻率則從5.3GHz提升到了5.5GHz,這個(gè)頻率已經(jīng)達(dá)到了i9-13900K的水準(zhǔn),因此可以想象i7-14700K/1470KF的游戲性能將無(wú)限接近于
    發(fā)表于 10-18 12:35 ?4795次閱讀
    <b class='flag-5'>i9-14900K</b>/<b class='flag-5'>i7-14700K</b><b class='flag-5'>處理</b>器首發(fā)評(píng)測(cè)

    英特爾酷睿i9-14900K首測(cè),i9-14900K性能怎么樣?

    相比酷睿13代i9-13900K處理器,酷睿14代i9-14900K處理器在工藝、架構(gòu)、核心、外觀設(shè)計(jì)上均沒有作出改變,依然是我們熟悉的Intel 7、10nm制造工藝。
    發(fā)表于 10-18 10:14 ?3046次閱讀
    <b class='flag-5'>英特爾</b>酷睿<b class='flag-5'>i9-14900K</b>首測(cè),<b class='flag-5'>i9-14900K</b><b class='flag-5'>性能</b>怎么樣?