0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Arm Kleidi加速AI發(fā)展

Arm社區(qū) ? 來(lái)源:Arm社區(qū) ? 2024-09-14 09:46 ? 次閱讀

作者:Arm 開(kāi)發(fā)者平臺(tái)副總裁 Geraint North

在持續(xù)快速發(fā)展的人工智能 (AI) 時(shí)代,我們堅(jiān)定地支持全球數(shù)百萬(wàn)開(kāi)發(fā)者,確保他們能夠獲得所需的性能、工具和軟件庫(kù),從而順利打造下一波令人驚嘆的 AI 體驗(yàn)。

為此,我們推出了 Arm Kleidi,這是一項(xiàng)廣泛的軟件和軟件社區(qū)參與計(jì)劃,旨在加速 AI 發(fā)展。其中的第一個(gè)舉措是推出面向熱門(mén) AI 框架的 Arm Kleidi 軟件庫(kù)。這使開(kāi)發(fā)者可以直接取得 Arm CPU 的出色 AI 功能,而如今全球從云端到邊緣側(cè)的大多數(shù) AI 推理工作負(fù)載都在這些 Arm CPU 上運(yùn)行。開(kāi)發(fā)者可以借助 Arm 超過(guò) 20 年的架構(gòu)創(chuàng)新,從 Armv7 架構(gòu)首次引入高級(jí)單指令多數(shù)據(jù) (SIMD) 擴(kuò)展以支持機(jī)器學(xué)習(xí) (ML) 工作負(fù)載,到如今的 Armv9 架構(gòu)在 Arm CPU 上囊括了加速和保護(hù)高級(jí)生成式 AI 工作負(fù)載的功能,這些創(chuàng)新持續(xù)推動(dòng) AI 能力和性能的提升。

Kleidi 軟件庫(kù)包含面向 AI 工作負(fù)載的 KleidiAI 和面向運(yùn)行于 Arm CPU 上出色的計(jì)算機(jī)視覺(jué)工作負(fù)載的 KleidiCV。該軟件庫(kù)可以被直接嵌入到熱門(mén)的 AI 框架中,開(kāi)發(fā)者無(wú)需進(jìn)行任何操作。如此一來(lái),開(kāi)發(fā)者可以輕松地啟用 Arm CPU 的 AI 功能,從而快速構(gòu)建 AI 應(yīng)用,并在盡可能廣泛的設(shè)備上實(shí)現(xiàn)最出色性能。

加速 AI 發(fā)展

為了應(yīng)對(duì)設(shè)備類(lèi)型、神經(jīng)網(wǎng)絡(luò)和推理引擎的爆發(fā)式增長(zhǎng),KleidiAI 是我們所給出的解決方案。它由一系列高度優(yōu)化的 AI 內(nèi)核組成,可在生成式 AI 等用例中實(shí)現(xiàn)高性能。KleidiAI 的優(yōu)勢(shì)在于,我們不會(huì)給開(kāi)發(fā)者額外增加工作量,而是直接與領(lǐng)先的 AI 框架合作,包括 MediaPipe(通過(guò) XNNPACK)、LLAMA.cpp、PyTorch(通過(guò) ExecuTorch)和 TensorFlow Lite(通過(guò) XNNPACK),以集成 KleidiAI。這不僅加快了開(kāi)發(fā)流程,并釋放了 AI 性能,為開(kāi)發(fā)者提供了默認(rèn)的高性能,使他們能夠順利地打造出色的 AI 體驗(yàn)。KleidiAI 還提供了前瞻性的兼容性,隨著我們推出更多的技術(shù),這將確保開(kāi)發(fā)者能夠充分利用未來(lái) AI 加速機(jī)會(huì)。

KleidiAI 的集成已經(jīng)為生成式 AI 工作負(fù)載帶來(lái)了顯著的性能提升。與參考實(shí)現(xiàn)方案(基于 llama.cpp,但不含我們的軟件 Kleidi 優(yōu)化)相比,在新的 Arm Cortex-X925 CPU 上,使用(集成了 KleidiAI 的)llama.cpp 的 Meta Llama 3 和微軟 Phi-3 大語(yǔ)言模型 (LLM) 的詞元 (Token) 首次響應(yīng)時(shí)間加快了 190%。KleidiAI 非常易于集成,Arm 的工程團(tuán)隊(duì)只用不到 24 小時(shí)就測(cè)出了 Llama 3 的優(yōu)化性能。此外,KleidiAI 還通過(guò) XNNPACK 與 MediaPipe 集成,為在移動(dòng)設(shè)備上運(yùn)行的開(kāi)源 Gemma LLM 提供支持。得益于此,Google Pixel 8 Pro 智能手機(jī)上 Gemma 2B 的詞元首次響應(yīng)時(shí)間縮短了 25%。

與此同時(shí),我們正在與 Unity 合作開(kāi)發(fā) Sentis,這是一個(gè)端側(cè) AI 推理引擎,可讓游戲開(kāi)發(fā)者在所有支持 Unity 游戲引擎的設(shè)備上打造創(chuàng)新的 AI 游戲體驗(yàn)。在集成 KleidAI 后,Unity Sentis 成功啟用了 int4 量化功能,將模型內(nèi)存占用率降低了 72.5%,同時(shí)在運(yùn)行 Phi-2 LLM 時(shí)性能提升了 660%。

加速計(jì)算機(jī)視覺(jué)發(fā)展

KleidiCV 能夠加速許多攝像頭用例中的計(jì)算機(jī)視覺(jué)管線。OpenCV 是全球最大的計(jì)算機(jī)視覺(jué)庫(kù),包含 2,500 多種算法,為數(shù)十萬(wàn)開(kāi)發(fā)者提供支持?;?KleidiCV 集成,OpenCV 發(fā)現(xiàn)各種圖像處理任務(wù)的典型性能提升高達(dá) 75%。作為我們與 OpenCV 的戰(zhàn)略軟件合作關(guān)系[1]的一部分,我們還首次將安卓構(gòu)建引入 Maven Central,這是一個(gè)面向 Java 開(kāi)發(fā)的開(kāi)源軟件組件、軟件庫(kù)的資源庫(kù)。

CPU 上的 AI 優(yōu)勢(shì)

Arm Kleidi 專(zhuān)注于加速 CPU 上的 AI 功能,因?yàn)樵诖蠖鄶?shù)情況下,所有 AI 工作負(fù)載都會(huì)從CPU 上開(kāi)始運(yùn)行。這使得 CPU 成為開(kāi)發(fā)者在為其 AI 工作負(fù)載設(shè)定目標(biāo)時(shí)的最便捷路徑。因此,我們?yōu)殚_(kāi)發(fā)者提供的這一路徑性能越出色,他們就更有可能在開(kāi)發(fā)過(guò)程中繼續(xù)使用 CPU 并將其作為目標(biāo)。此外,隨著 LLM 變得更小更高效,越來(lái)越多的 AI 工作負(fù)載將適合在 CPU 上處理。最終,開(kāi)發(fā)過(guò)程將變得更加順暢、無(wú)縫,進(jìn)而優(yōu)化開(kāi)發(fā)者的 AI 工作負(fù)載性能。

在 Arm 平臺(tái)上構(gòu)建 AI 的未來(lái)

Arm Kleidi 的推出再次突顯了 Arm 作為端側(cè)生成式 AI 計(jì)算平臺(tái)的領(lǐng)先地位。它使開(kāi)發(fā)者無(wú)需學(xué)習(xí)額外的工具和技能,就能夠在非常廣泛的硬件中獲得 Arm CPU 的出色 AI 性能。隨著我們不斷創(chuàng)新,持續(xù)為新一代 AI 打造前沿架構(gòu),開(kāi)發(fā)者未來(lái)將能夠獲得更強(qiáng)大、更先進(jìn)的 AI 功能。對(duì)于最終用戶(hù)來(lái)說(shuō),這意味著更快速、更智能、更具交互性、更沉浸式、更安全的出色 AI 體驗(yàn)。

Arm Kleidi 的推出只是一個(gè)開(kāi)端,我們未來(lái)還計(jì)劃推出更多軟件庫(kù)、計(jì)算內(nèi)核和引擎集成。我們將持續(xù)在 Arm 平臺(tái)上構(gòu)建 AI 的未來(lái)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    134

    文章

    8967

    瀏覽量

    365034
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28877

    瀏覽量

    266225
  • 開(kāi)發(fā)者
    +關(guān)注

    關(guān)注

    1

    文章

    528

    瀏覽量

    16914

原文標(biāo)題:Arm Kleidi 助力 AI 開(kāi)發(fā)者加速創(chuàng)新

文章出處:【微信號(hào):Arm社區(qū),微信公眾號(hào):Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Arm如何賦能無(wú)處不在的AI

    作為人工智能 (AI) 的創(chuàng)新基礎(chǔ),眾多企業(yè)都在使用通用且應(yīng)用廣泛的 Arm 計(jì)算平臺(tái)。迄今為止,合作伙伴基于 Arm 架構(gòu)的芯片出貨量已逾 2,800 億顆。如今,Arm 已為各類(lèi)技
    的頭像 發(fā)表于 09-14 09:38 ?261次閱讀

    Arm KleidiAI軟件庫(kù)的功能解析

    推出了 Arm Kleidi,這是一項(xiàng)廣泛的軟件和軟件社區(qū)參與計(jì)劃,旨在加速 AI 發(fā)展。其中的第一個(gè)舉措是推出面向熱門(mén)
    的頭像 發(fā)表于 09-05 15:41 ?175次閱讀
    <b class='flag-5'>Arm</b> KleidiAI軟件庫(kù)的功能解析

    ARM:AI時(shí)代的創(chuàng)新驅(qū)動(dòng),有望奪下Windows PC市場(chǎng)50%

    在COMPUTEX 2024展會(huì)期間,半導(dǎo)體IP巨頭Arm召開(kāi)了主題為“加速云至邊緣AI創(chuàng)新”的演講。他們預(yù)計(jì),到2025年底,全球?qū)⒂谐^(guò)1000億臺(tái)搭載Arm處理器的
    的頭像 發(fā)表于 06-05 17:18 ?571次閱讀

    聯(lián)發(fā)科加入Arm,加速AI應(yīng)用性能與效率

    6月5日消息,人工智能(AI)無(wú)疑是推動(dòng)技術(shù)發(fā)展的強(qiáng)大引擎。在這個(gè)充滿(mǎn)機(jī)遇與挑戰(zhàn)的交匯點(diǎn)上,COMPUTEX 2024展會(huì)上傳來(lái)了一則令人振奮的消息:全球領(lǐng)先的芯片設(shè)計(jì)公司聯(lián)發(fā)科宣布正式加入Arm
    的頭像 發(fā)表于 06-05 16:26 ?535次閱讀

    MediaTek加入Arm全面設(shè)計(jì)生態(tài)項(xiàng)目 塑造AI計(jì)算的未來(lái)

    滿(mǎn)足數(shù)據(jù)中心、基礎(chǔ)設(shè)施系統(tǒng)、電信等領(lǐng)域的 AI 應(yīng)用性能和效率需求,并加速和簡(jiǎn)化產(chǎn)品開(kāi)發(fā)。 ? MediaTek 公司副總經(jīng)理 Vince Hu 表示:“ MediaTek 與 Arm 將共同合作,使
    的頭像 發(fā)表于 06-04 20:09 ?1200次閱讀
    MediaTek加入<b class='flag-5'>Arm</b>全面設(shè)計(jì)生態(tài)項(xiàng)目 塑造<b class='flag-5'>AI</b>計(jì)算的未來(lái)

    Arm發(fā)布全新終端計(jì)算子系統(tǒng),加速AI體驗(yàn)與產(chǎn)品上市

    全球領(lǐng)先的半導(dǎo)體知識(shí)產(chǎn)權(quán)(IP)提供商Arm控股有限公司(納斯達(dá)克股票代碼:ARM)今日正式推出全新的Arm終端計(jì)算子系統(tǒng)(CSS),以推動(dòng)人工智能(AI)體驗(yàn)的前沿
    的頭像 發(fā)表于 05-30 14:23 ?474次閱讀

    Arm推出AI優(yōu)化的Arm終端CSS以及新的Arm Kleidi軟件

    Arm 終端計(jì)算子系統(tǒng) (CSS) 作為新的計(jì)算解決方案,結(jié)合了 Armv9 架構(gòu)的優(yōu)勢(shì),以及基于三納米工藝節(jié)點(diǎn),經(jīng)過(guò)驗(yàn)證和證實(shí)為生產(chǎn)就緒的新 Arm CPU 和 GPU 實(shí)現(xiàn),可賦能芯片合作伙伴快速創(chuàng)新,
    的頭像 發(fā)表于 05-30 11:33 ?479次閱讀
    <b class='flag-5'>Arm</b>推出<b class='flag-5'>AI</b>優(yōu)化的<b class='flag-5'>Arm</b>終端CSS以及新的<b class='flag-5'>Arm</b> <b class='flag-5'>Kleidi</b>軟件

    Arm發(fā)布新一代Ethos-U AI加速Arm旨在瞄準(zhǔn)國(guó)產(chǎn)CPU市場(chǎng)

    Arm發(fā)布的新一代Ethos-U AI加速器確實(shí)在業(yè)界引起了廣泛關(guān)注。
    的頭像 發(fā)表于 04-18 15:59 ?612次閱讀

    Arm推動(dòng)生成式AI落地邊緣!全新Ethos-U85 AI加速器支持Transformer 架構(gòu),性能提升四倍

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)在嵌入式領(lǐng)域,邊緣與端側(cè)AI推理需求不斷增長(zhǎng),Arm既有Helium 技術(shù)使 CPU 能夠執(zhí)行更多計(jì)算密集型的 AI 推理算法,也有Ethos 系列 AI
    的頭像 發(fā)表于 04-16 09:10 ?4289次閱讀
    <b class='flag-5'>Arm</b>推動(dòng)生成式<b class='flag-5'>AI</b>落地邊緣!全新Ethos-U85 <b class='flag-5'>AI</b><b class='flag-5'>加速</b>器支持Transformer 架構(gòu),性能提升四倍

    家居智能化,推動(dòng)AI加速器的發(fā)展

    提高了系統(tǒng)的運(yùn)算能力和數(shù)據(jù)處理能力,還為用戶(hù)帶來(lái)了更加智能化、個(gè)性化的生活體驗(yàn)。 ? AI 加速器的發(fā)展 ? 在人工智能和機(jī)器學(xué)習(xí)任務(wù)變得日益復(fù)雜和密集之前,傳統(tǒng)的CPU和GPU已經(jīng)足以處理這些任務(wù)。然而,隨著深度學(xué)習(xí)模型的出現(xiàn)
    的頭像 發(fā)表于 02-23 00:18 ?4406次閱讀

    【國(guó)產(chǎn)FPGA+OMAPL138開(kāi)發(fā)板體驗(yàn)】(原創(chuàng))5.FPGA的AI加速源代碼

    OMAP-L138(定點(diǎn)/浮點(diǎn)DSP C674x+ARM9)+ FPGA處理器的開(kāi)發(fā)板。 編寫(xiě)一個(gè)用于AI加速的FPGA程序是一個(gè)相當(dāng)復(fù)雜的過(guò)程,涉及硬件描述語(yǔ)言(如VHDL或Verilog)以及針對(duì)特定
    發(fā)表于 02-12 16:18

    Arm攜手Cadence加速AI時(shí)代芯片開(kāi)發(fā)

    隨著人工智能 (AI) 的快速發(fā)展,使用經(jīng)優(yōu)化的芯片對(duì)于打造新一代應(yīng)用至關(guān)重要。
    的頭像 發(fā)表于 01-04 14:08 ?907次閱讀

    基于紫光同創(chuàng)FPGA的圖像采集及AI加速(盤(pán)古50K開(kāi)發(fā)板)

    基于紫光同創(chuàng)FPGA的圖像采集及AI加速(盤(pán)古50K開(kāi)發(fā)板)
    發(fā)表于 11-03 11:02

    新思科技與Arm持續(xù)深化合作,加速先進(jìn)節(jié)點(diǎn)定制芯片設(shè)計(jì)

    全球領(lǐng)先的新思科技IP解決方案和AI驅(qū)動(dòng)型EDA全面解決方案與“Arm全面設(shè)計(jì)”相結(jié)合,大幅加速復(fù)雜SoC設(shè)計(jì)的上市時(shí)間 摘要: 新思科技加入“Arm全面設(shè)計(jì)”(
    發(fā)表于 11-01 10:47 ?269次閱讀

    Cadence 與 Arm Total Design 合作,加速開(kāi)發(fā)基于 Arm 的定制 SoC

    雙方的共同客戶(hù)可獲取 Cadence 的全流程系統(tǒng)級(jí)設(shè)計(jì)驗(yàn)證和實(shí)現(xiàn)解決方案以及接口 IP,依托 Neoverse CSS 加速開(kāi)發(fā)基于 Arm 的定制 SoC 中國(guó)上海,2023 年 10 月 25
    的頭像 發(fā)表于 10-25 10:40 ?334次閱讀
    Cadence 與 <b class='flag-5'>Arm</b> Total Design 合作,<b class='flag-5'>加速</b>開(kāi)發(fā)基于 <b class='flag-5'>Arm</b> 的定制 SoC