0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在同一邊緣設(shè)備上運(yùn)行多個(gè)應(yīng)用程序

星星科技指導(dǎo)員 ? 來(lái)源:NVIDIA ? 作者:Troy Estes ? 2022-10-10 14:22 ? 次閱讀

智能空間是最豐富的邊緣人工智能用例之一。從智能零售店到自主工廠,企業(yè)很快就能看到這項(xiàng)創(chuàng)新技術(shù)的價(jià)值。然而,構(gòu)建和擴(kuò)展智能空間需要許多不同的技術(shù),包括多種應(yīng)用。在邊緣位置操作多個(gè)應(yīng)用程序可能很復(fù)雜。

為此,組織可能會(huì)向某個(gè)位置添加新硬件,以便每個(gè)應(yīng)用程序都有專用的計(jì)算資源,但與購(gòu)買和安裝每個(gè)新應(yīng)用程序的新硬件相關(guān)的成本可能會(huì)很高。許多組織在同一設(shè)備上部署多個(gè)應(yīng)用程序。

雖然這是一種規(guī)模解決方案,但它可能會(huì)帶來(lái)不同的挑戰(zhàn)。

許多組織依靠 GPU 的性能來(lái)支持邊緣應(yīng)用程序。即使使用高性能 GPU 加速系統(tǒng),使用時(shí)間切片在同一設(shè)備上同時(shí)運(yùn)行兩個(gè)或多個(gè) AI 應(yīng)用程序也不可避免地會(huì)導(dǎo)致更高的延遲,而硬件優(yōu)化最少。

當(dāng)多個(gè)應(yīng)用程序在同一設(shè)備上運(yùn)行時(shí),設(shè)備將應(yīng)用程序時(shí)間切片到隊(duì)列中,以便應(yīng)用程序按順序運(yùn)行,而不是并發(fā)運(yùn)行。當(dāng)設(shè)備從一個(gè)應(yīng)用程序的處理數(shù)據(jù)切換到另一個(gè)應(yīng)用程序時(shí),結(jié)果總是有延遲。每個(gè)部署的延遲量不同,但可能高達(dá) 8 毫秒。這可能會(huì)嚴(yán)重影響為高速操作提供動(dòng)力的應(yīng)用,例如制造生產(chǎn)線。

由于應(yīng)用程序是按順序運(yùn)行的, GPU 僅在每個(gè)應(yīng)用程序運(yùn)行時(shí)根據(jù)需要使用。例如,如果有三個(gè)應(yīng)用程序在 GPU 上順序運(yùn)行,并且每個(gè)應(yīng)用程序需要 60% 的 GPU 資源,那么在任何給定時(shí)間,使用的 GPU 都不到 60% 。在每次上下文切換期間, GPU 利用率將為 0% 。

有幾種方法可以避免時(shí)間分割,更好地利用 GPU 資源。

NVIDIA 多實(shí)例 GPU

NVIDIA 多實(shí)例 GPU ( MIG ) 是一種功能,使您能夠?qū)?GPU 劃分為多個(gè)實(shí)例,每個(gè)實(shí)例都有自己的計(jì)算核心,從而實(shí)現(xiàn) GPU 的全部計(jì)算能力。 MIG 通過(guò)隔離應(yīng)用程序并為每個(gè)應(yīng)用程序分配資源,緩解了應(yīng)用程序爭(zhēng)奪資源的問(wèn)題。 MIG 還允許更好的資源優(yōu)化和低延遲。

通過(guò)提供多達(dá)七個(gè)不同的分區(qū),您可以支持從最小到最大的每個(gè)工作負(fù)載,并提供有效操作每個(gè)已部署應(yīng)用程序所需的確切計(jì)算能力。

除了性能之外, MIG 還為每個(gè)實(shí)例的計(jì)算、內(nèi)存和緩存分配了一組硬件資源,從而增加了安全性和彈性。 MIG 為工作負(fù)載提供故障隔離,其中一個(gè)實(shí)例中運(yùn)行的應(yīng)用程序引起的故障不會(huì)影響其他實(shí)例上運(yùn)行的應(yīng)用程序。如果一個(gè)工作負(fù)載失敗,所有其他工作負(fù)載將繼續(xù)不間斷地運(yùn)行,因?yàn)閷?shí)例和工作負(fù)載并行運(yùn)行,同時(shí)保持獨(dú)立和隔離。

MIG 同樣適用于容器或虛擬機(jī)( VM )。當(dāng)使用虛擬機(jī)時(shí),使用 NVIDIA vGPU 可以很容易地虛擬化 GPU ,可以將其配置為使用時(shí)間切片或 MIG 。

MIG 用于邊緣 AI

在部署邊緣人工智能時(shí),優(yōu)化成本、功率和空間都是重要的考慮因素,特別是如果您想要復(fù)制到數(shù)千個(gè)邊緣節(jié)點(diǎn)。通過(guò)允許組織在同一 GPU 上運(yùn)行多個(gè)應(yīng)用程序, MIG 消除了為每個(gè)工作負(fù)載安裝專用 GPU 的需要,顯著降低了資源需求。

除了資源優(yōu)化之外, MIG 還有助于確??深A(yù)測(cè)的應(yīng)用程序性能。如果沒(méi)有 MIG ,在同一 GPU 上運(yùn)行的不同作業(yè)(如不同的 AI 推斷請(qǐng)求)會(huì)爭(zhēng)奪相同的資源,如內(nèi)存和帶寬。由于時(shí)間切片中固有的資源競(jìng)爭(zhēng),一個(gè)應(yīng)用程序的性能可能會(huì)受到另一個(gè)應(yīng)用程序中活動(dòng)的影響。對(duì)于邊緣人工智能環(huán)境,不可預(yù)測(cè)的性能可能會(huì)產(chǎn)生嚴(yán)重后果。

例如,監(jiān)控生產(chǎn)線以檢測(cè)產(chǎn)品缺陷的計(jì)算機(jī)視覺(jué)應(yīng)用程序必須能夠即時(shí)對(duì)其動(dòng)態(tài)環(huán)境作出反應(yīng)。它必須能夠快速檢查產(chǎn)品,并且在出現(xiàn)缺陷產(chǎn)品的情況下,能夠與其他機(jī)器通信以停止生產(chǎn)線。為了安全和效率,組織必須知道,為其生產(chǎn)線供電的人工智能應(yīng)用程序一直在正確且可預(yù)測(cè)地運(yùn)行。

使用不同資源同時(shí)運(yùn)行的作業(yè)具有可預(yù)測(cè)的性能、服務(wù)質(zhì)量和最大 GPU 利用率,使 MIG 成為每個(gè)邊緣部署的重要補(bǔ)充。

pYYBAGNDumaAZ_oaAAWkbGMr3vM947.png

圖 1 。每個(gè) MIG 實(shí)例可以處理一個(gè)獨(dú)立的工作負(fù)載,優(yōu)化需要同時(shí)操作多個(gè)用例的環(huán)境

MIG on NVIDIA Fleet Command

Fleet Command 是一種云服務(wù),集中連接邊緣位置的系統(tǒng),從一個(gè)儀表板安全部署、管理和擴(kuò)展人工智能應(yīng)用程序。專門(mén)為邊緣人工智能構(gòu)建, Fleet Command 是跨數(shù)百甚至數(shù)千臺(tái)設(shè)備編排人工智能的最佳方式。

通過(guò) Fleet Command 云平臺(tái),管理員可以完全控制 MIG 進(jìn)行邊緣人工智能部署,只需最少的配置。在 Fleet Command 上使用 MIG 只需點(diǎn)擊幾下,您就可以跨數(shù)百甚至數(shù)千個(gè)設(shè)備做出資源利用率決策。您可以輕松地添加新的 MIG 分區(qū),縮小現(xiàn)有分區(qū),并創(chuàng)建自定義部署,所有這些都可以從一個(gè)儀表板上完成。

Fleet Command 和 MIG 的結(jié)合為組織提供了完全控制邊緣人工智能部署所需的所有功能,從而提高了工作負(fù)載的利用率和效率。

關(guān)于作者

Troy Estes 是 NVIDIA Edge 和企業(yè)計(jì)算解決方案的產(chǎn)品營(yíng)銷經(jīng)理。在加入 Edge & Enterprise 業(yè)務(wù)部門(mén)之前,特洛伊曾在自主汽車業(yè)務(wù)部門(mén)和 NVIDIA 電網(wǎng)產(chǎn)品集團(tuán)從事?tīng)I(yíng)銷活動(dòng)和支持產(chǎn)品 GTM 。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4862

    瀏覽量

    102722
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4678

    瀏覽量

    128613
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    邊緣計(jì)算架構(gòu)設(shè)計(jì)最佳實(shí)踐

    。 邊緣網(wǎng)關(guān) :作為中間層,聚合多個(gè)邊緣設(shè)備的數(shù)據(jù),執(zhí)行初步處理與過(guò)濾,有時(shí)還承擔(dān)設(shè)備管理、協(xié)議轉(zhuǎn)換等功能。
    的頭像 發(fā)表于 10-24 14:17 ?312次閱讀

    邊緣計(jì)算與云計(jì)算的區(qū)別

    地點(diǎn),如設(shè)備、傳感器等。計(jì)算任務(wù)邊緣設(shè)備上進(jìn)行,而不是集中中央云服務(wù)器。 云計(jì)算 :將計(jì)算資源集中
    的頭像 發(fā)表于 10-24 14:08 ?234次閱讀

    多個(gè)網(wǎng)站放在同一臺(tái)服務(wù)器ip有什么影響?

    多個(gè)網(wǎng)站放在同一臺(tái)服務(wù)器,使用同一個(gè)IP地址,可能會(huì)有以下影響: 1、資源共享:多個(gè)網(wǎng)站共享同一
    的頭像 發(fā)表于 09-12 11:15 ?271次閱讀

    TM4C MCU用FreeRTOS開(kāi)發(fā)通用應(yīng)用程序應(yīng)用說(shuō)明

    電子發(fā)燒友網(wǎng)站提供《TM4C MCU用FreeRTOS開(kāi)發(fā)通用應(yīng)用程序應(yīng)用說(shuō)明.pdf》資料免費(fèi)下載
    發(fā)表于 09-11 14:15 ?0次下載
    <b class='flag-5'>在</b>TM4C MCU<b class='flag-5'>上</b>用FreeRTOS開(kāi)發(fā)通用<b class='flag-5'>應(yīng)用程序</b>應(yīng)用說(shuō)明

    讓YUV2演示FX3的內(nèi)存運(yùn)行,啟動(dòng)數(shù)據(jù)流時(shí)卻無(wú)法正常工作,應(yīng)用程序會(huì)崩潰,為什么?

    效(我看到了我的 4 幀樣本),但啟動(dòng)數(shù)據(jù)流時(shí)卻無(wú)法正常工作,應(yīng)用程序會(huì)崩潰。 linux 運(yùn)行時(shí),v4L2 報(bào)告說(shuō)它根本不起作用: VIDIOC_STREAMON return
    發(fā)表于 05-28 08:18

    部署邊緣設(shè)備的輕量級(jí)模型

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)邊緣AI算法是種將人工智能(AI)算法和計(jì)算能力放置接近數(shù)據(jù)源的終端設(shè)備中的策略。這種算法通常被部署
    的頭像 發(fā)表于 05-11 00:17 ?2528次閱讀

    應(yīng)用程序中的服務(wù)器錯(cuò)誤怎么解決?

    使用應(yīng)用程序時(shí),可能會(huì)遇到服務(wù)器錯(cuò)誤的問(wèn)題。這種錯(cuò)誤通常會(huì)導(dǎo)致應(yīng)用程序無(wú)法正常運(yùn)行 ,給用戶帶來(lái)不便。下面將介紹應(yīng)用程序中的服務(wù)器錯(cuò)誤及其
    的頭像 發(fā)表于 03-12 15:13 ?5582次閱讀

    STM32MP135使用SD卡啟動(dòng)應(yīng)用程序,應(yīng)用程序是需要在DDR運(yùn)行,DDR初始化,已經(jīng)FSBL鏡像里面嗎?

    使用SD卡啟動(dòng)應(yīng)用程序,應(yīng)用程序是需要在DDR運(yùn)行,DDR初始化,已經(jīng)FSBL鏡像里面嘛 求大佬指點(diǎn)
    發(fā)表于 03-11 08:31

    蘋(píng)果手機(jī)用同一個(gè)id怎么取消同步

    蘋(píng)果手機(jī)用同一個(gè)id怎么取消同步? 取消蘋(píng)果手機(jī)間的同步功能可以通過(guò)以下步驟完成。請(qǐng)注意,這些步驟適用于iOS 11及更高版本。 步驟1:打開(kāi)“設(shè)置”應(yīng)用程序 首先,打開(kāi)您的iPhone或iPad
    的頭像 發(fā)表于 02-19 10:19 ?2931次閱讀

    u8g2應(yīng)用程序無(wú)法moduStoolBox中構(gòu)建是為什么?

    u8g2 庫(kù)。 要將其添加到應(yīng)用程序中的哪里? 我試圖將其加載到libs目錄下,但是當(dāng)我這樣做時(shí),它會(huì)產(chǎn)生70多個(gè)錯(cuò)誤。 我相信我已經(jīng)在下面的壓縮文件中附上了我的應(yīng)用程序。 我 C
    發(fā)表于 01-24 07:03

    2023?年最適用于邊緣計(jì)算項(xiàng)目的?7?種硬件設(shè)備,Orange Pi榜上有名

    邊緣計(jì)算概述“邊緣”究竟是什么,根據(jù)您的參考框架可能會(huì)有很大的不同。邊緣計(jì)算可以是簡(jiǎn)單的內(nèi)容交付網(wǎng)絡(luò)(CDN),為靜態(tài)文件提供服務(wù)以降低加載時(shí)間;也可以是將應(yīng)用程序部署
    的頭像 發(fā)表于 01-05 17:54 ?2046次閱讀
    2023?年最適用于<b class='flag-5'>邊緣</b>計(jì)算項(xiàng)目的?7?種硬件<b class='flag-5'>設(shè)備</b>,Orange Pi榜上有名

    【從0開(kāi)始創(chuàng)建AWTK應(yīng)用程序】編譯應(yīng)用到嵌入式Linux平臺(tái)運(yùn)行

    。搭建Linux平臺(tái)交叉編譯環(huán)境在上篇文章我們介紹了使用AWTK開(kāi)發(fā)簡(jiǎn)單的應(yīng)用并在PC模擬運(yùn)行,本篇文章就來(lái)介紹下怎么讓應(yīng)用程序
    的頭像 發(fā)表于 12-07 12:08 ?655次閱讀
    【從0開(kāi)始創(chuàng)建AWTK<b class='flag-5'>應(yīng)用程序</b>】編譯應(yīng)用到嵌入式Linux平臺(tái)<b class='flag-5'>運(yùn)行</b>

    vlookup 匹配同一值的多個(gè)結(jié)果

    ,我們將探討如何使用VLOOKUP函數(shù)來(lái)實(shí)現(xiàn)匹配同一值的多個(gè)結(jié)果,解決這個(gè)常見(jiàn)的需求。 、VLOOKUP函數(shù)回顧 開(kāi)始之前,我們先回顧
    的頭像 發(fā)表于 12-03 10:27 ?1.5w次閱讀

    LabVIEW不同操作系統(tǒng)使VI、可執(zhí)行文件或安裝程序

    的??蓤?zhí)行文件必須在目標(biāo)操作系統(tǒng)構(gòu)建,并且不能在另個(gè)操作系統(tǒng)同一操作系統(tǒng)的另個(gè)版本
    發(fā)表于 12-02 21:47

    【從0開(kāi)始創(chuàng)建AWTK應(yīng)用程序】創(chuàng)建應(yīng)用程序并在模擬器運(yùn)行

    AWTK是基于C語(yǔ)言開(kāi)發(fā)的跨平臺(tái)GUI框架。本系列文章介紹如何從0開(kāi)始創(chuàng)建AWTK應(yīng)用程序,包括搭建開(kāi)發(fā)調(diào)試環(huán)境、使用AWTK創(chuàng)建Hello工程并在模擬器運(yùn)行、將AWTK應(yīng)用程序移植
    的頭像 發(fā)表于 12-01 08:24 ?456次閱讀
    【從0開(kāi)始創(chuàng)建AWTK<b class='flag-5'>應(yīng)用程序</b>】創(chuàng)建<b class='flag-5'>應(yīng)用程序</b>并在模擬器<b class='flag-5'>運(yùn)行</b>