0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

基于 ODLA 的異構 AI 硬件對接方案介紹

lhl545545 ? 來源:與非網(wǎng) ? 作者:與非網(wǎng) ? 2020-09-25 17:25 ? 次閱讀

在剛剛結束的 2020 云棲大會上,阿里云宣布對行業(yè)開源業(yè)界首個深度學習開放接口標準 ODLA(Open Deep Learning API)。阿里云在今年 5 月份的 OCP 全球峰會上首次對外公布 ODLA 接口標準,并宣布已率先在 Graphcore 等生態(tài)伙伴上獲得支持。IPU 是 Graphcore 為機器智能從零設計的 AI 處理器,通過 ODLA 接口,開發(fā)者可以在 IPU 上快速跑通 AI Matrix 的各類模型。

基于 ODLA 的異構 AI 硬件對接方案介紹

張偉豐博士在 2020 OCP 全球峰會上公布 ODLA 接口標準

ODLA 是一個為加速深度學習的統(tǒng)一異構硬件編程接口。ODLA 規(guī)范了深度學習計算任務的定義和執(zhí)行,實現(xiàn)上層應用和底層異構硬件平臺的解耦,讓 AI 異構計算更簡單,實踐代碼“生成一次,隨時鏈接,隨處執(zhí)行”的愿景。

“令人興奮的新應用程序意味著我們對數(shù)據(jù)中心的期望比以往任何時候都要更高。我們希望通過使用更廣泛的硬件選擇,以更大的規(guī)模,擴大操作類型范圍。ODLA 使我們能夠管理這種復雜性,并挖掘出這些出色的新技術的全部潛力?!盙raphcore 高級副總裁兼中國區(qū)總經(jīng)理盧濤表示。

阿里云開發(fā) ODLA 是為了解決異構計算中存在許久的一個核心挑戰(zhàn)。ODLA 是輕量高效的異構硬件統(tǒng)一接口標準,可在異構計算環(huán)境中實現(xiàn)效率最大化。在異構計算環(huán)境中,軟件框架需要從專業(yè)芯片中獲得最高性能,需要多種類型處理器在一個通用平臺上協(xié)同工作,而每種處理器都需要針對其架構和專業(yè)知識領域進行某種程度的優(yōu)化,例如 AI 的稀疏性。API 提供的抽象級別可以適應芯片架構之間的差異。

基于 ODLA 的異構 AI 硬件對接方案

通過 ODLA,在 Graphcore IPU 上技術適配和應用部署的工作量可以實現(xiàn)大幅度降低,且實現(xiàn)效率大幅提升。另外,通過 ODLA 可以更好的與 AI 計算框架進行軟硬協(xié)同,快速利用現(xiàn)有的編譯優(yōu)化技術,達到最佳性能。對于異構任務,ODLA 充當該系統(tǒng)范圍通用語言與特定于架構的優(yōu)化之間的接口或轉換器,該優(yōu)化可從 Graphcore 的 IPU 等設備實現(xiàn)最佳性能。

對于數(shù)據(jù)中心運營商而言,除了簡化了新微處理器技術的集成之外,ODLA 還帶來了其他一系列好處。它支持通用和高性能的數(shù)據(jù)中心設置,并為高級應用程序提供統(tǒng)一的加速框架。對于應用程序開發(fā)人員來說,它減少了對不同架構進行重復優(yōu)化的需求,并應該可以減少開發(fā)成本,縮短產(chǎn)品上市時間。

ODLA 在 2020 云棲大會上宣布的主要特性及優(yōu)勢包含:

透明接口層,零損耗。

接口抽象和統(tǒng)一,軟硬件解耦:通過面向 AI 的多粒度算子抽象,定義統(tǒng)一的接口,解耦具體軟硬件,平滑遷移業(yè)務;實現(xiàn)代碼復用,提升開發(fā)和部署效率。

多模態(tài)執(zhí)行方式:支持多種執(zhí)行模式,覆蓋解釋執(zhí)行、編譯執(zhí)行、載入預編譯代碼等場景,兼容各種硬件的運行模式。

AI 全場景支持:支持推理和訓練,適配云、邊、端全場景 AI 業(yè)務;擁有廣泛的算子定義和豐富的接口(設備管理、會話管理、執(zhí)行管理、事件同步 / 異步、資源查詢、性能監(jiān)控等)。

卓越的擴展性,支持 AI 芯片廠家獨特屬性和自定義算子。

張偉豐博士在云棲大會上宣布開源 ODLA

Graphcore 公司相信,IPU 將成為下一代數(shù)據(jù)中心 AI 工作負載的核心。我們深知,我們的愿景需要 ODLA 在內(nèi)的諸多框架和工具,這些框架和工具能使我們的產(chǎn)品與其他同類最佳技術協(xié)同工作。

Graphcore 的聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Nigel Toon 表示:“ODLA 優(yōu)雅地滿足了 Graphcore 新用戶的兩個最大需求。一是他們希望輕松地將我們的技術集成到現(xiàn)有的數(shù)據(jù)中心,二是他們希望確保最終的設置在從各個組件到整個系統(tǒng)的每個層級都能得到高度優(yōu)化?!?br /> 責任編輯:pj

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19103

    瀏覽量

    228823
  • AI
    AI
    +關注

    關注

    87

    文章

    29821

    瀏覽量

    268111
  • 阿里云
    +關注

    關注

    3

    文章

    934

    瀏覽量

    42932
收藏 人收藏

    評論

    相關推薦

    深蕾半導體ASTRA AI詳細介紹

    ASTRA AI芯片是一種集成了多種計算單元(包括NPU/uNPU、GPU、CPU、DSP等)的異構計算系統(tǒng)級芯片(SOC),專為處理復雜的人工智能(AI)任務而設計。這種設計使得ASTRA
    的頭像 發(fā)表于 09-12 16:49 ?262次閱讀
    深蕾半導體ASTRA <b class='flag-5'>AI</b>詳細<b class='flag-5'>介紹</b>

    淺談國產(chǎn)異構雙核RISC-V+FPGA處理器AG32VF407的優(yōu)勢和應用場景

    任務優(yōu)化計算資源,提高整體計算效率。 靈活性與可擴展性 : FPGA的靈活性允許用戶根據(jù)需求重新配置硬件邏輯,實現(xiàn)高度定制化的解決方案。結合RISC-V的開放架構,用戶可以更容易地根據(jù)應用需求調整
    發(fā)表于 08-31 08:32

    開啟全新AI時代 智能嵌入式系統(tǒng)快速發(fā)展——“第六屆國產(chǎn)嵌入式操作系統(tǒng)技術與產(chǎn)業(yè)發(fā)展論壇”圓滿結束

    操作系統(tǒng)標準化的最新進展。 華為計算產(chǎn)業(yè)戰(zhàn)略規(guī)劃總監(jiān)周明耀在論壇上做了“華為在AI硬件上積累及生態(tài)戰(zhàn)略”專題報告。周明耀介紹華為計算產(chǎn)業(yè)在AI
    發(fā)表于 08-30 17:24

    安謀科技異構算力組合,破局生成式AI算力挑戰(zhàn)

    近日,此芯科技集團有限公司(以下簡稱“此芯科技”)AI PC戰(zhàn)略暨首款芯片發(fā)布會在上海舉行,正式推出了其首款專為AI PC打造的異構高能效芯片產(chǎn)品——“此芯P1”。作為國產(chǎn)新一代AI
    的頭像 發(fā)表于 08-13 09:12 ?499次閱讀

    安謀科技異構算力賦能AI計算,此芯科技首款AI PC芯片發(fā)布

    7月30日,此芯科技集團有限公司(以下簡稱“此芯科技”)AI PC戰(zhàn)略暨首款芯片發(fā)布會在上海舉行,正式推出了其首款專為AI PC打造的異構高能效芯片產(chǎn)品——“此芯P1”。作為國產(chǎn)新一代AI
    發(fā)表于 07-31 14:36 ?988次閱讀
    安謀科技<b class='flag-5'>異構</b>算力賦能<b class='flag-5'>AI</b>計算,此芯科技首款<b class='flag-5'>AI</b> PC芯片發(fā)布

    異構混訓整合不同架構芯片資源,提高算力利用率

    的解決方案。通過混合使用多種異構芯片,可以充分利用不同芯片的優(yōu)勢,提高算力利用率,降低算力成本,并推動AI技術的廣泛應用。 ? 異構混訓能夠整合不同架構芯片資源 ? 在2024年世界人
    的頭像 發(fā)表于 07-18 00:11 ?3300次閱讀

    開發(fā)者手機 AI - 目標識別 demo

    。 NNRt host 實現(xiàn)了NNRt HDI接口功能,通過對接底層AI芯片接口為上層應用提供NPU硬件推理的能力。 功能實現(xiàn) JS從相機數(shù)據(jù)流獲取一張圖片,調用Native的接口進行目標識別的處理
    發(fā)表于 04-11 16:14

    邁爾微視重磅推出高精度對接相機M4 Mega

    為移動機器人、人形機器人貨物抓取、高精度對接提供3D視覺+AI一體化解決方案
    的頭像 發(fā)表于 03-19 10:14 ?671次閱讀
    邁爾微視重磅推出高精度<b class='flag-5'>對接</b>相機M4 Mega

    高通NPU和異構計算提升生成式AI性能?

    異構計算的重要性不可忽視。根據(jù)生成式AI的獨特需求和計算負擔,需要配備不同的處理器,如專注于AI工作負載的定制設計的NPU、CPU和GPU。
    的頭像 發(fā)表于 03-06 14:15 ?707次閱讀

    CES AI硬件層出不窮:你愿為AI的溢價買單嗎?

    硬件AI
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2024年01月30日 16:36:00

    燧原科技與青云科技達成戰(zhàn)略合作,創(chuàng)新異構算力調度

    NEWS 燧原科技與青云科技日前達成戰(zhàn)略合作,攜手創(chuàng)新算力異構資源池的靈活調度,共建支持場景落地的AI算力生態(tài),為AI應用快速落地、AI算力普惠提供驅動力。 人工智能技術的發(fā)展正在步入
    的頭像 發(fā)表于 12-11 12:20 ?583次閱讀

    異構專用AI芯片的黃金時代

    異構專用AI芯片的黃金時代
    的頭像 發(fā)表于 12-04 16:42 ?583次閱讀
    <b class='flag-5'>異構</b>專用<b class='flag-5'>AI</b>芯片的黃金時代

    華秋第九屆硬創(chuàng)大賽全國總決賽邀你一同見證~

    算法的行業(yè)首創(chuàng)多鏡頭多傳感器(MLMS)機器視覺集成方案 -12.PINPOINT手術機器人- 以賦能醫(yī)院手術能力,提升醫(yī)院手術效率為使命,通過機器人+AI的方式實現(xiàn)精準醫(yī)療普及化。 06 主辦方介紹
    發(fā)表于 11-17 15:33

    華秋第九屆硬創(chuàng)大賽全國總決賽,邀你一同見證~

    算法的行業(yè)首創(chuàng)多鏡頭多傳感器(MLMS)機器視覺集成方案 -12.PINPOINT手術機器人- 以賦能醫(yī)院手術能力,提升醫(yī)院手術效率為使命,通過機器人+AI的方式實現(xiàn)精準醫(yī)療普及化。 06 主辦方介紹
    發(fā)表于 11-17 15:30

    賦能“AI+行業(yè)”應用!廣州高企高質量發(fā)展對接會(人工智能場景供需對接專場)成功舉辦

    賦能“AI+行業(yè)”應用!廣州高企高質量發(fā)展對接會(人工智能場景供需對接專場)成功舉辦 為促進人工智能產(chǎn)業(yè)鏈上下游以及與其他產(chǎn)業(yè)鏈的融合發(fā)展,共同推動民營企業(yè)實現(xiàn)高質量發(fā)展,持續(xù)壯大企業(yè)科技創(chuàng)新
    的頭像 發(fā)表于 11-13 10:19 ?1035次閱讀
    賦能“<b class='flag-5'>AI</b>+行業(yè)”應用!廣州高企高質量發(fā)展<b class='flag-5'>對接</b>會(人工智能場景供需<b class='flag-5'>對接</b>專場)成功舉辦