0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA Riva可快速開發(fā)出GPU加速對話式AI應(yīng)用

科技綠洲 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 作者:NVIDIA英偉達(dá)企業(yè)解 ? 2022-04-29 14:33 ? 次閱讀

AI 機器人和其他自主機器的開發(fā)和部署步伐不斷加快。隨著新一代應(yīng)用的出現(xiàn),需要大幅提升 AI 的計算性能才能處理實時并行運行的多模態(tài) AI 應(yīng)用。

在零售店、食品配送、醫(yī)院、倉庫、工廠車間和其他商業(yè)應(yīng)用中,人類與機器人的互動日益增加。這些自主機器人必須同時執(zhí)行 3D 感知、自然語言理解、路徑規(guī)劃、避障、位姿估測等行為。這些行為既需要超高的計算性能,還需要為每個應(yīng)用訓(xùn)練高度準(zhǔn)確的神經(jīng)模型。

NVIDIA Jetson AGX Orin 模塊是 NVIDIA Jetson 家族的最新成員并且在其中具有最強大的性能。該模塊具有異常強大的性能和領(lǐng)先的能效,可以運行所有 NVIDIA AI 軟件堆棧并驅(qū)動新一代高要求邊緣 AI 應(yīng)用。

Jetson AGX Orin 和 Jetson Orin NX 系列

在 2022 年春季 GTC 大會上,我們宣布在今年第四季度推出四款 Jetson Orin 模塊。Jetson Orin 模塊的最高性能達(dá)到每秒 275 萬億次運算(TOPS),可在邊緣運行服務(wù)器級別的 AI 并且具有端到端應(yīng)用流水線加速功能。與 Jetson Xavier 模塊相比,Jetson Orin 為現(xiàn)代 AI 應(yīng)用帶來了更高的性能、能效和推理能力。

Jetson AGX Orin 系列包括 Jetson AGX Orin 64GB 和 Jetson AGX Orin 32GB 模塊。

Jetson AGX Orin 64GB 最高算力為 275 TOPS,功率配置范圍 15W 至 60W。

Jetson AGX Orin 32GB 最高算力為 200 TOPS,功率配置范圍 15W 至 40W。

這些模塊具有相同的緊湊外型,與 Jetson AGX Xavier 系列模塊引腳兼容,性能提升了 8 倍或在相同的價格下提升了 6 倍。

邊緣和嵌入式系統(tǒng)傳感器數(shù)量、性能和帶寬繼續(xù)增加。Jetson AGX Orin 系列不僅提供用于處理這些傳感器的額外算力,而且還增加了 I/O:

多達(dá)22條PCIe Gen4通道

4個10Gb以太網(wǎng)

速度更快的CSI通道

采用64GB eMMC 5.1的雙倍存儲空間

1.5倍內(nèi)存帶寬

USB 3.2、UFS、MGBE 和 PCIe 共享 UPHY 通道。關(guān)于所支持的UPHY配置,請參見設(shè)計指南(https://developer.nvidia.com/embedded/downloads#?search=Jetson%20AGX%20Orin%20Product%20Design%20Guide)。

NVIDIA Orin NX 系列包括 Jetson Orin NX 16GB 和 Jetson Orin NX 8GB,前者的最大 AI 算力為 100 TOPS,后者的最大 AI 算力為 70 TOPS。該系列采用與 Jetson Xavier NX 類似的設(shè)計理念。我們將 NVIDIA Orin 架構(gòu)封裝到最小的 Jetson 外形尺寸中(即 260 針SODIMM)并且實現(xiàn)了更低的功耗。

您可以在無人機、手持設(shè)備等新一代小尺寸產(chǎn)品中實現(xiàn)這一更加強大的性能。Jetson Orin NX 16GB 的功率配置范圍是 10W 至 25W,Jetson Orin NX 8GB 的功率配置范圍是 10W 至 20W。

Orin NX 系列的外形與 Jetson Xavier NX 系列兼容,性能是后者的 5 倍或在相同價格下是后者的 3 倍。Orin NX 系列還提供額外的高速 I/O 能力,有多達(dá) 7 個 PCIe 通道和 3 個 10Gbps USB 3.2 接口。您可以使用額外的 PCIe 通道連接外部 NVMe 來擴展存儲空間。

Jetson AGX Xavier 圍繞 NVIDIA Xavier 系統(tǒng)級芯片設(shè)計,NVIDIA Xavier 是我們?yōu)樽灾鳈C器重新開發(fā)的第一個架構(gòu)。NVIDIA Orin 架構(gòu)將此類產(chǎn)品提升到一個新的級別,我們在此基礎(chǔ)上不斷開發(fā)出能力、性能與能效更強大的系統(tǒng)級芯片。

Jetson Orin 模塊包含以下內(nèi)容:

NVIDIA Ampere 架構(gòu) GPU,具有多達(dá) 2048 個 CUDA 核和多達(dá) 64 個 Tensor 核

多達(dá) 12 個 Arm A78AE CPU

兩個新一代深度學(xué)習(xí)加速器(DLA)

計算機視覺加速器

各種其他用于減輕GPU和CPU處理器的負(fù)擔(dān):

視頻編碼器

視頻解碼器

視頻圖像合成器

圖像信號處理器

傳感器處理引擎

音頻處理引擎

與其他 Jetson 模塊一樣,Jetson Orin 采用了系統(tǒng)級模塊(SOM)設(shè)計。所有處理、內(nèi)存和電源軌都包含在模塊上。所有高速 I/O 均通過一個 699 針的連接器(Jetson AGX Orin 系列)或一個 260 針的 SODIMM 連接器(Jetson Orin NX 系列)提供。這種 SOM 設(shè)計能夠讓您輕松地將模塊集成到您的系統(tǒng)設(shè)計中。

Jetson AGX Orin 開發(fā)者套件

在 GTC 2022 上,NVIDIA 還宣布推出 Jetson AGX Orin 開發(fā)者套件。該開發(fā)套件包含了快速啟動和運行所需的一切工具。它包括一個最高性能的 Jetson AGX Orin 模塊并運行全球最先進(jìn)的深度學(xué)習(xí)軟件堆棧。該套件提供創(chuàng)建當(dāng)前和未來復(fù)雜 AI 解決方案所需的靈活性。

憑借緊湊的尺寸、高速接口和大量連接器,該開發(fā)者套件非常適合用于制造、物流、零售、服務(wù)、農(nóng)業(yè)、智慧城市、醫(yī)療、生命科學(xué)等領(lǐng)域的高級 AI 機器人和邊緣應(yīng)用原型設(shè)計。

Jetson AGX Orin開發(fā)者套件包含:

NVIDIA Ampere 架構(gòu) GPU 和 12 核 Arm Cortex-A78AE 64 位 CPU,以及新一代深度學(xué)習(xí)和視覺加速器

高速 I/O、204.8 GB/s 內(nèi)存帶寬和 32 GB DRAM,能夠為多個并行 AI 應(yīng)用流水線提供支持

強大的 NVIDIA AI 軟件堆棧并支持 SDK 和軟件平臺,包括:

NVIDIA JetPack

NVIDIA Riva

NVIDIA DeepStream

NVIDIA Isaac

NVIDIA TAO

Jetson AGX Orin 開發(fā)者套件運行最新的 NVIDIA JetPack 5.0軟件。NVIDIA JetPack 5.0 支持通過 Jetson AGX Orin 開發(fā)者套件模擬 Jetson Orin NX 和 Jetson AGX Orin 系列模塊的性能和時鐘頻率。您今天就可以開始開發(fā)這些模塊中的任何一個。

Jetson AGX Orin 開發(fā)者套件通過 NVIDIA 全球授權(quán)經(jīng)銷商銷售。您可以根據(jù)入門指南開始使用該套件。

一流的性能

Jetson Orin 大幅提升新一代應(yīng)用的性能。通過使用 Jetson AGX Orin 開發(fā)者套件,我們測得了我們高精度、生產(chǎn)級、預(yù)訓(xùn)練計算機視覺和對話式 AI 模型性能的幾何平均值。測試包括以下基準(zhǔn):

用于人員檢測的 NVIDIA PeopleNet

NVIDIA ActionRecognitionNet 2D 和 3D 模型

用于車牌識別的 NVIDIA LPRNet

用于多人位姿估測的 NVIDIA DashcamNet、BodyPoseNet

用于語音識別的 Citrinet-1024

用于自然語言處理的 BERT-base

用于文本-語音轉(zhuǎn)換的 FastPitchHifiGanE2E

在 NVIDIA JetPack 5.0 開發(fā)者預(yù)覽版中,Jetson AGX Orin 的性能比 Jetson AGX Xavier 提高了 3.3 倍。隨著今后的軟件改進(jìn),我們預(yù)計將實現(xiàn)接近 5 倍的性能提升。自首個支持該軟件的版本—— NVIDIA JetPack 4.1.1 開發(fā)者預(yù)覽版以來,Jetson AGX Xavier 的性能已提高了 1.5 倍。

這些基準(zhǔn)測試已在我們的 Jetson AGX Orin 開發(fā)者套件上運行。PeopleNet 和 DashcamNet 提供在 GPU 和兩個 DLA 上同時運行密集模型的示例。DLA 可以用于卸載 GPU 上的一些 AI 應(yīng)用,并且這一并行能力使它們能夠并行運行。

PeopleNet、LPRNet、DashcamNet 和 BodyPoseNet 提供在 Jetson 上運行密集 INT8 基準(zhǔn)測試的示例。ActionRecognitionNet 2D 和 3D 以及對話式 AI 基準(zhǔn)測試提供密集 FP16 性能的示例。

此外,Jetson Orin 繼續(xù)提高邊緣 AI 的標(biāo)桿,在最新 MLPerf 行業(yè)推理基準(zhǔn)測試中進(jìn)一步鞏固 NVIDIA 的整體領(lǐng)先優(yōu)勢。在此次 MLPerf 基準(zhǔn)測試中,與 Jetson AGX Xavier 之前的結(jié)果相比,Jetson AGX Orin 的性能提高了 5 倍,能效平均提高了 2 倍。

通過Jetson軟件加快產(chǎn)品上市時間

依靠強大的 NVIDIA 軟件,Jetson Orin 實現(xiàn)了領(lǐng)先的性能和能效。這些軟件被部署在 GPU 加速數(shù)據(jù)中心、超大規(guī)模服務(wù)器和高性能 AI 工作站中。

NVIDIA JetPack 是 Jetson 平臺的基礎(chǔ) SDK。NVIDIA JetPack 為硬件加速邊緣AI的開發(fā)提供了一個完整的開發(fā)環(huán)境。Jetson Orin 得到了 NVIDIA JetPack 5.0 的支持,后者包括:

LTS 內(nèi)核 5.10

基于 Ubuntu 20.04 的根文件系統(tǒng)

基于 UEFI 的引導(dǎo)程序

帶有 CUDA 11.4、TensorRT 8.4 和 cuDNN 8.3 的最新計算堆棧

NVIDIA JetPack 5.0 還支持 Jetson Xavier 模塊。

為了讓您在 Jetson 平臺上能夠快速開發(fā)全面加速的應(yīng)用,NVIDIA 為各種不同的用例提供了應(yīng)用框架:

使用 DeepStream 快速開發(fā)和部署視覺 AI 應(yīng)用和服務(wù)。DeepStream 提供超越推理的硬件加速,它能為端到端 AI 流水線提供硬件加速插件。

NVIDIA Isaac 提供硬件加速 ROS 程序包,使 ROS 開發(fā)者更容易構(gòu)建高性能機器人解決方案。

Omniverse 驅(qū)動的 NVIDIA Isaac Sim 能夠創(chuàng)造高度逼真、達(dá)到物理級準(zhǔn)確的虛擬環(huán)境,該工具可用于開發(fā)、測試和管理 AI 機器人。

NVIDIA Riva 為自動語音識別(ASR)和文本-語音轉(zhuǎn)換(TTS)提供最先進(jìn)、可以輕松自定義的預(yù)訓(xùn)練模型。這些模型使您能夠快速開發(fā)出 GPU 加速對話式 AI 應(yīng)用。

為了加快生產(chǎn)級、高精度 AI 模型的開發(fā),NVIDIA 提供多種工具用于生成訓(xùn)練數(shù)據(jù)、訓(xùn)練和優(yōu)化模型以及快速創(chuàng)建可立即部署的 AI 模型。

用于生成合成數(shù)據(jù)的 NVIDIA Omniverse Replicator 能夠創(chuàng)建促進(jìn)模型訓(xùn)練的高質(zhì)量數(shù)據(jù)集。您可以使用 Omniverse Replicator 創(chuàng)建大型、多樣化的合成數(shù)據(jù)集,這些數(shù)據(jù)集在現(xiàn)實世界中不僅難以創(chuàng)建,有時甚至不可能創(chuàng)建。使用合成數(shù)據(jù)和真實數(shù)據(jù)來訓(xùn)練模型可以顯著提高模型的準(zhǔn)確率。

NGC 上的 NVIDIA 預(yù)訓(xùn)練模型為您提供用于各種用例的高精度優(yōu)化模型和模型架構(gòu)。這些預(yù)訓(xùn)練模型為生產(chǎn)級模型。通過 NVIDIA TAO(訓(xùn)練-調(diào)整-優(yōu)化)工作流程,您可以使用自己的真實或合成數(shù)據(jù)訓(xùn)練并進(jìn)一步自定義這些模型,最終快速構(gòu)建一個準(zhǔn)確、可立即部署的模型。

審核編輯:彭菁
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    6808

    瀏覽量

    88743
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4855

    瀏覽量

    102711
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4673

    瀏覽量

    128593
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29806

    瀏覽量

    268106
收藏 人收藏

    評論

    相關(guān)推薦

    NVIDIA生成AI進(jìn)入ROS社區(qū)

    NVIDIA 在 ROSCon 上發(fā)布更新,旨在加速 AI 驅(qū)動的機械臂和自主移動機器人的開發(fā)。
    的頭像 發(fā)表于 10-31 14:41 ?180次閱讀

    HOMEE AI利用NVIDIA Omniverse開發(fā)出AI即服務(wù)”空間規(guī)劃解決方案

    HOMEE AINVIDIA 初創(chuàng)加速計劃成員。該公司開發(fā)了一種“AI 即服務(wù)”空間規(guī)劃解決方案,旨在為價值 6500 億美元的全球家
    的頭像 發(fā)表于 09-09 10:00 ?388次閱讀
    HOMEE <b class='flag-5'>AI</b>利用<b class='flag-5'>NVIDIA</b> Omniverse<b class='flag-5'>開發(fā)出</b>“<b class='flag-5'>AI</b>即服務(wù)”空間規(guī)劃解決方案

    NVIDIA AI助力SAP生成AI助手Joule加速發(fā)展

    在美國佛羅里達(dá)州奧蘭多舉行的 SAP Sapphire 大會上,NVIDIA 與這家企業(yè)軟件公司公布了搭載NVIDIA AI Enterprise軟件的生成
    的頭像 發(fā)表于 09-09 09:37 ?356次閱讀

    NVIDIA加速計算和生成AI領(lǐng)域的創(chuàng)新

    在最新發(fā)布的公司 2024 財年可持續(xù)發(fā)展報告開篇的一封信中,NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛介紹了 NVIDIA加速計算和生成 AI
    的頭像 發(fā)表于 09-09 09:18 ?477次閱讀

    揭秘NVIDIA AI Workbench 如何助力應(yīng)用開發(fā)

    者能夠根據(jù)其具體需求調(diào)整 AI 模型。 此類工作在過去可能需要復(fù)雜的設(shè)置,而新工具使這項工作變得空前簡單。 NVIDIA AI Workbench 協(xié)助
    發(fā)表于 07-10 18:51 ?600次閱讀
    揭秘<b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Workbench 如何助力應(yīng)用<b class='flag-5'>開發(fā)</b>

    HPE 攜手 NVIDIA 推出 NVIDIA AI Computing by HPE,加速生成 AI 變革

    by HPE 包含了持續(xù)的加速計算產(chǎn)品組合以及全生命周期服務(wù),將簡化 AI 創(chuàng)造價值的過程,加速生成
    的頭像 發(fā)表于 06-21 14:39 ?307次閱讀

    NVIDIA推出NVIDIA AI Computing by HPE加速生成 AI 變革

    作為極具開創(chuàng)性的一站“交鑰匙”私有云人工智能(private-cloud AI)解決方案,NVIDIA AI Computing by HPE 包含了
    的頭像 發(fā)表于 06-20 17:36 ?661次閱讀

    NVIDIA發(fā)布DeepStream 7.0,助力下一代視覺AI開發(fā)

    NVIDIA DeepStream 是一款功能強大的 SDK,能夠提供用于構(gòu)建端到端視覺 AI 管線的 GPU 加速構(gòu)建模塊。
    的頭像 發(fā)表于 05-23 10:09 ?523次閱讀
    <b class='flag-5'>NVIDIA</b>發(fā)布DeepStream 7.0,助力下一代視覺<b class='flag-5'>AI</b><b class='flag-5'>開發(fā)</b>

    NVIDIA AI微服務(wù)現(xiàn)已與AWS集成,加速藥物研發(fā)和數(shù)字醫(yī)療

    NVIDIA NIM 使數(shù)千家使用 AWS 的醫(yī)療和生命科學(xué)公司能夠快速、輕松開發(fā)和部署生成 AI
    的頭像 發(fā)表于 05-09 09:21 ?1499次閱讀

    利用NVIDIA組件提升GPU推理的吞吐

    本實踐中,唯品會 AI 平臺與 NVIDIA 團(tuán)隊合作,結(jié)合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網(wǎng)絡(luò)和熱
    的頭像 發(fā)表于 04-20 09:39 ?614次閱讀

    NVIDIA和谷歌云宣布開展一項新的合作,加速AI開發(fā)

    NVIDIA 和谷歌云宣布開展一項新的合作,以幫助全球初創(chuàng)企業(yè)加速創(chuàng)建生成 AI 應(yīng)用和服務(wù)。
    的頭像 發(fā)表于 04-11 14:03 ?448次閱讀

    NVIDIA數(shù)字人技術(shù)加速部署生成AI驅(qū)動的游戲角色

    NVIDIA 在 GDC 2024 大會上宣布,Inworld AI 等領(lǐng)先的 AI 應(yīng)用程序開發(fā)者,正在使用 NVIDIA 數(shù)字人技術(shù)
    的頭像 發(fā)表于 04-09 10:08 ?608次閱讀
    <b class='flag-5'>NVIDIA</b>數(shù)字人技術(shù)<b class='flag-5'>加速</b>部署生成<b class='flag-5'>式</b><b class='flag-5'>AI</b>驅(qū)動的游戲角色

    NVIDIA加速識因智能AI大模型落地應(yīng)用方面的重要作用介紹

    本案例介紹了 NVIDIA加速識因智能 AI 大模型落地應(yīng)用方面的重要作用。生成大模型已廣泛應(yīng)用于各領(lǐng)域,通過學(xué)習(xí)人類思維方式,能快速
    的頭像 發(fā)表于 03-29 15:28 ?569次閱讀

    SAP與NVIDIA攜手加速生成AI在企業(yè)應(yīng)用中的普及

    SAP SE 和 NVIDIA 宣布深化合作,致力于加速企業(yè)客戶在 SAP 云解決方案和應(yīng)用組合中利用數(shù)據(jù)和生成 AI 的變革力量。
    的頭像 發(fā)表于 03-22 10:02 ?552次閱讀

    NVIDIA 初創(chuàng)加速計劃 Omniverse 加速

    的重要力量?;?NVIDIA 全棧 AI 計算平臺和 Omniverse TM 平臺上的生成 AI 創(chuàng)作實踐,讓企業(yè)、
    的頭像 發(fā)表于 12-04 20:35 ?607次閱讀
    <b class='flag-5'>NVIDIA</b> 初創(chuàng)<b class='flag-5'>加速</b>計劃 Omniverse <b class='flag-5'>加速</b>營