0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

模型部署是打通AI應(yīng)用的最后一公里

大魚機(jī)器人 ? 來(lái)源:大魚機(jī)器人 ? 作者:大魚機(jī)器人 ? 2022-06-07 11:06 ? 次閱讀

深度學(xué)習(xí)產(chǎn)業(yè)落地過(guò)程中,我們經(jīng)常能聽到一種說(shuō)法——模型部署是打通AI應(yīng)用的最后一公里!想要走通這一公里,看似簡(jiǎn)單,但是真正實(shí)踐起來(lái)卻困難重重:顯卡利用率低、內(nèi)存溢出、多線程調(diào)度奔潰、TensorRT加速算子不支持等等問(wèn)題一直是深度學(xué)習(xí)模型最后部署的老大難問(wèn)題。

工業(yè)制造環(huán)境中,Windows系統(tǒng)有著廣泛的應(yīng)用。為了更好的幫助工業(yè)用戶解決落地最后的一公里問(wèn)題,飛槳聯(lián)合產(chǎn)業(yè)用戶,基于Windows系統(tǒng),提供了工業(yè)級(jí)的部署Demo,支持圖像分類、目標(biāo)檢測(cè)、實(shí)例分割和語(yǔ)義分割模型的部署,并提供了一鍵的TensorRT加速方式,極大的提升了部署的效率,同時(shí)支持多線程推理的方式,滿足了用戶多視頻輸入預(yù)測(cè)的需求!

c78d1f72-e56d-11ec-ba43-dac502259ad0.png

圖1部署開發(fā)示例說(shuō)明

支持多種類別模型部署

滿足多種場(chǎng)景需求

為了更好的滿足用戶多種視覺(jué)任務(wù)場(chǎng)景,部署Demo基于PaddleX的Deployment模塊進(jìn)行二次開發(fā),不僅僅支持對(duì)PaddleX自身訓(xùn)練的模型進(jìn)行推理,同時(shí)支持PaddleClas、PaddleDetection、PaddleSeg視覺(jué)開發(fā)套件的模型,滿足多種場(chǎng)景需求。

c7c5c11a-e56d-11ec-ba43-dac502259ad0.png

圖2 部署Demo支持模型說(shuō)明

一鍵TensorRT加速

部署效率顯著提升

NVIDIA TensorRT 是一個(gè)高性能的深度學(xué)習(xí)預(yù)測(cè)庫(kù),可為深度學(xué)習(xí)推理應(yīng)用程序提供低延遲和高吞吐量。在部署Demo中集成了TensorRT預(yù)測(cè)庫(kù),用戶只需一鍵啟動(dòng),即可進(jìn)行高性能的部署。

c7e01bfa-e56d-11ec-ba43-dac502259ad0.png

圖3 部署Demo性能對(duì)比說(shuō)明

為了更好的幫助用戶了解在工業(yè)制造場(chǎng)景部署的問(wèn)題,飛槳邀請(qǐng)產(chǎn)業(yè)用戶現(xiàn)場(chǎng)coding,一步步帶著大家現(xiàn)場(chǎng)演示如何搭建部署開發(fā)示例,如何更高性能的應(yīng)用在自己的產(chǎn)業(yè)落地中。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28877

    瀏覽量

    266228
  • 圖像分類
    +關(guān)注

    關(guān)注

    0

    文章

    89

    瀏覽量

    11887
  • 工業(yè)制造
    +關(guān)注

    關(guān)注

    0

    文章

    398

    瀏覽量

    27995

原文標(biāo)題:TensorRT加速、多線程部署,打通工業(yè)高性能部署最后一公里

文章出處:【微信號(hào):All_best_xiaolong,微信公眾號(hào):大魚機(jī)器人】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    中軟國(guó)際模型工場(chǎng)加速各行業(yè)智能化進(jìn)程

    華為開發(fā)者大會(huì)2024在東莞松山湖盛大召開。在大會(huì)主題演講環(huán)節(jié), 中軟國(guó)際華為業(yè)務(wù)集團(tuán)模型工場(chǎng)業(yè)務(wù)部總裁曾菲發(fā)表了《打通AI應(yīng)用最后一公里,
    的頭像 發(fā)表于 09-19 14:14 ?126次閱讀
    中軟國(guó)際<b class='flag-5'>模型</b>工場(chǎng)加速各行業(yè)智能化進(jìn)程

    亞馬遜云科技與伊克羅德信息攜手,共推AI賦能產(chǎn)業(yè)升級(jí)

    近日,伊克羅德信息科技,作為業(yè)界領(lǐng)先的數(shù)智化轉(zhuǎn)型服務(wù)商,與亞馬遜云科技正式簽署了項(xiàng)為期四年的市場(chǎng)拓展戰(zhàn)略合作計(jì)劃(SCA)。雙方將深度整合云端前沿技術(shù)與生成式AI解決方案,旨在打通AI
    的頭像 發(fā)表于 08-07 17:56 ?760次閱讀

    言犀智能體平臺(tái)上線了!趕緊來(lái)試試!連接大模型與企業(yè)應(yīng)用的“最后一公里

    言犀智能體平臺(tái)是企業(yè)級(jí)站式 AI 智能體搭建與發(fā)布平臺(tái)。聚合大模型、知識(shí)庫(kù)、插件、工作流等能力,為用戶提供低成本將LLM落地為企業(yè)應(yīng)用的SaaS平臺(tái)。無(wú)需代碼基礎(chǔ)亦可便捷的使用大模型
    的頭像 發(fā)表于 08-07 14:47 ?127次閱讀

    億鑄科技談大算力芯片面臨的技術(shù)挑戰(zhàn)和解決策略

    隨著人工智能技術(shù)的飛速發(fā)展,算力已成為推動(dòng)產(chǎn)業(yè)變革的關(guān)鍵力量,但大模型的快速發(fā)展,參數(shù)的爆發(fā),對(duì)于算力需求也提出了更高的要求,帶來(lái)了全新的挑戰(zhàn)。那大算力芯片應(yīng)對(duì)這些挑戰(zhàn),如何才能夠助力人工智能技術(shù)的發(fā)展,實(shí)現(xiàn)算力的落地和最后一公里
    的頭像 發(fā)表于 08-07 10:03 ?512次閱讀

    利用恩智浦云實(shí)驗(yàn)室部署AI模型

    如今,人工智能(AI)非?;鸨@個(gè)風(fēng)口該如何把握?作為個(gè)電子工程師,和AI最主要的交集應(yīng)該就是邊緣計(jì)算了,具體來(lái)講,就是在些性能、功耗以及價(jià)格相對(duì)較低的嵌入式平臺(tái)上
    的頭像 發(fā)表于 08-02 11:46 ?2468次閱讀
    利用恩智浦云實(shí)驗(yàn)室<b class='flag-5'>部署</b><b class='flag-5'>AI</b><b class='flag-5'>模型</b>

    英偉達(dá)推出Flextron AI框架:賦能靈活高效的AI模型部署

    在人工智能與機(jī)器學(xué)習(xí)領(lǐng)域,隨著技術(shù)的不斷演進(jìn),模型的高效部署與適應(yīng)性成為研究的新熱點(diǎn)。近日,英偉達(dá)與德克薩斯大學(xué)奧斯汀分校攜手宣布了項(xiàng)重大突破——推出了種名為FLEXTRON的新型
    的頭像 發(fā)表于 07-18 15:22 ?2464次閱讀

    北京靈奧科技基于亞馬遜云科技打造大模型中間件

    企業(yè)AI應(yīng)用落地的最后一公里。靈奧科技現(xiàn)已服務(wù)全球超過(guò)30,000家用戶,廣泛覆蓋電商、金融、法律、房地產(chǎn)、教育和能源等行業(yè)。 大模型中間件是基于基礎(chǔ)
    的頭像 發(fā)表于 06-27 21:21 ?442次閱讀

    云天勵(lì)飛正式發(fā)布“深目”AI模盒,讓大模型應(yīng)用平民化

    3月28日,云天勵(lì)飛舉辦AI模型產(chǎn)品發(fā)布會(huì),正式發(fā)布“深目”AI模盒。該產(chǎn)品能夠做到“3個(gè)90%”——覆蓋場(chǎng)景超過(guò)90%、算法精度超過(guò)90%,使用成本降低90%,解決大模型在場(chǎng)景落地
    的頭像 發(fā)表于 03-29 09:24 ?314次閱讀

    使用CUBEAI部署tflite模型到STM32F0中,模型創(chuàng)建失敗怎么解決?

    看到CUBE_AI已經(jīng)支持到STM32F0系列芯片,就想拿來(lái)入門嵌入式AI。 生成的模型很小,是可以部署到F0上的,但是直無(wú)法創(chuàng)建成功。
    發(fā)表于 03-15 08:10

    智能硬件 | AI PC新市場(chǎng),英特爾、高通、AMD、蘋果誰(shuí)能拔得頭籌?

    人想罵句“人工智障”。手機(jī)、音箱的“小藝小愛(ài)”們,只能做些約定俗成框架的事,目前用起來(lái)是沒(méi)感覺(jué)他能學(xué)習(xí)的。但AI PC貌似可以走完我與大模型
    的頭像 發(fā)表于 03-05 15:51 ?471次閱讀
    智能硬件 | <b class='flag-5'>AI</b> PC新市場(chǎng),英特爾、高通、AMD、蘋果誰(shuí)能拔得頭籌?

    科技賦能,MTW400A為農(nóng)村飲水安全打通最后一公里

    “三網(wǎng)四帶”總體格局。聚焦國(guó)家省級(jí)水網(wǎng)先導(dǎo)區(qū)建設(shè)重點(diǎn)任務(wù)。重點(diǎn)實(shí)施骨干水網(wǎng)工程、農(nóng)村供水保障工程、中小河流治理工程和大中型灌區(qū)續(xù)建配套與現(xiàn)代化改造等。、漫途農(nóng)飲
    的頭像 發(fā)表于 02-28 16:24 ?216次閱讀
    科技賦能,MTW400A為農(nóng)村飲水安全<b class='flag-5'>打通</b>“<b class='flag-5'>最后</b><b class='flag-5'>一公里</b>”

    科技賦能,MTW400A為農(nóng)村飲水安全打通最后一公里

    “三網(wǎng)四帶”總體格局。聚焦國(guó)家省級(jí)水網(wǎng)先導(dǎo)區(qū)建設(shè)重點(diǎn)任務(wù)。重點(diǎn)實(shí)施骨干水網(wǎng)工程、農(nóng)村供水保障工程、中小河流治理工程和大中型灌區(qū)續(xù)建配套與現(xiàn)代化改造等。 、農(nóng)飲水遠(yuǎn)程在線監(jiān)測(cè)方案 農(nóng)飲水遠(yuǎn)程在線監(jiān)測(cè)方案,通過(guò)
    的頭像 發(fā)表于 02-28 14:13 ?230次閱讀
    科技賦能,MTW400A為農(nóng)村飲水安全<b class='flag-5'>打通</b>“<b class='flag-5'>最后</b><b class='flag-5'>一公里</b>”

    中軟國(guó)際模型工廠,打通模型應(yīng)用落地“最后一公里

    各領(lǐng)域大咖聚焦根技術(shù)創(chuàng)新、開源合作、AI模型、平臺(tái)工具等熱門話題,探尋影響中國(guó)數(shù)字經(jīng)濟(jì)發(fā)展的新技術(shù)、新趨勢(shì)、新賽道、新業(yè)態(tài),洞察行業(yè)發(fā)展機(jī)遇。 中軟國(guó)際華為業(yè)務(wù)集團(tuán)CTO范鍇鍇出席本次活動(dòng), 并在“中國(guó)程序員全體會(huì)議”上發(fā)表了
    的頭像 發(fā)表于 10-25 15:55 ?445次閱讀
    中軟國(guó)際<b class='flag-5'>模型</b>工廠,<b class='flag-5'>打通</b>大<b class='flag-5'>模型</b>應(yīng)用落地“<b class='flag-5'>最后</b><b class='flag-5'>一公里</b>”

    【KV260視覺(jué)入門套件試用體驗(yàn)】Vitis AI 構(gòu)建開發(fā)環(huán)境,并使用inspector檢查模型

    量化 七、Vitis AI 通過(guò)遷移學(xué)習(xí)訓(xùn)練自定義模型 八、Vitis AI 將自定義模型編譯并部署到KV260中 鋪墊 Vitis
    發(fā)表于 10-14 15:34

    I/O-Link打通工業(yè)底層現(xiàn)場(chǎng)設(shè)備通信的“最后一公里

    電子發(fā)燒友網(wǎng)報(bào)道(文/李寧遠(yuǎn))I/O-Link是種標(biāo)準(zhǔn)化協(xié)議,用于調(diào)節(jié)工業(yè)系統(tǒng)中的傳感器并與控制器進(jìn)行交互,被譽(yù)為通向各種執(zhí)行器和傳感器的最后環(huán)。 ? 現(xiàn)在工業(yè)自動(dòng)化現(xiàn)場(chǎng)的各種測(cè)量傳感器都需要
    的頭像 發(fā)表于 10-07 08:09 ?2081次閱讀
    I/O-Link<b class='flag-5'>打通</b>工業(yè)底層現(xiàn)場(chǎng)設(shè)備通信的“<b class='flag-5'>最后</b><b class='flag-5'>一公里</b>”