0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA GPU加速AI推理洞察,推動(dòng)跨行業(yè)創(chuàng)新

NVIDIA英偉達(dá) ? 來(lái)源:英偉達(dá)NVIDIA中國(guó) ? 2020-07-02 15:00 ? 次閱讀

隨著數(shù)據(jù)集的增長(zhǎng)和分析神經(jīng)網(wǎng)絡(luò)的復(fù)雜化,越來(lái)越多的用戶選擇通過(guò)NVIDIA GPU加速AI推理。當(dāng)前,人工智能的應(yīng)用正從農(nóng)業(yè)領(lǐng)域擴(kuò)展到X射線領(lǐng)域,而NVIDIA GPU正是AI推理跨行業(yè)創(chuàng)新的助燃劑。

人工智能的應(yīng)用,正從農(nóng)業(yè)領(lǐng)域拓展醫(yī)學(xué)、X射線等各個(gè)領(lǐng)域,原因是因?yàn)樗鼈儞碛兄诤A繑?shù)據(jù)迅速推斷出精明之選的神奇能力。

隨著數(shù)據(jù)集的增長(zhǎng)和分析神經(jīng)網(wǎng)絡(luò)的復(fù)雜化,越來(lái)越多的用戶選擇用NVIDIA GPU來(lái)加速AI推理。

想要了解它們的實(shí)際應(yīng)用,看看下面這些家喻戶曉的公司產(chǎn)品就能明白。

美國(guó)通用的GEResearch在航空、醫(yī)療保健、電力和運(yùn)輸行業(yè)中部署了使用GPU加速的AI模型。這些模型實(shí)現(xiàn)了工廠檢查自動(dòng)化,為智能列車的運(yùn)行提供保障,并能監(jiān)控電站以及解釋醫(yī)學(xué)圖像。

這些AI模型被運(yùn)行在裝載了V100Tensor Core GPU的NVIDIADGX系統(tǒng)上的數(shù)據(jù)中心服務(wù)器上,以及裝載了JetsonAGX Xavier模塊的邊緣計(jì)算網(wǎng)絡(luò)中。該硬件運(yùn)行NVIDIA的TensorRT推理引擎及其用于深度學(xué)習(xí)的CUDA/ cuDNN加速庫(kù),以及用于Jetson模塊的NVIDIAJetPack工具套件。

推理賦能視頻應(yīng)用程序與合同管理

在消費(fèi)市場(chǎng)上,全球兩個(gè)最受歡迎的移動(dòng)視頻應(yīng)用程序均在NVIDIA GPU上運(yùn)行AI推理。

TikTok及其在中國(guó)的前身“抖音”在2019年2月全球下載量達(dá)到10億次。字節(jié)跳動(dòng)作為這兩個(gè)應(yīng)用程序的開(kāi)發(fā)者和所有者,每天為4億活躍用戶每天上傳多達(dá)5000萬(wàn)個(gè)新視頻。

字節(jié)跳動(dòng)在數(shù)千個(gè)NVIDIA T4和P4 GPU服務(wù)器上運(yùn)行TensorRT,用戶因此可以搜索并獲得有關(guān)精彩視頻的推薦。該公司估計(jì), NVIDIA產(chǎn)品已幫助公司節(jié)省了數(shù)百萬(wàn)美元,同時(shí)將在線服務(wù)的延遲減少了一半。

在商業(yè)領(lǐng)域,德勤在其dTrax軟件中使用AI推理來(lái)幫助公司管理復(fù)雜的合同。例如,當(dāng)法規(guī)發(fā)生變化或公司計(jì)劃進(jìn)行大規(guī)模收購(gòu)時(shí),dTrax可以定位并更新長(zhǎng)期協(xié)議中的關(guān)鍵條款。

當(dāng)前全球有多家公司使用dTrax。該軟件在數(shù)據(jù)中心的NVIDIA DGX-1系統(tǒng)和云中的AWS P3實(shí)例上運(yùn)行,在2019年獲得了《金融時(shí)報(bào)》的智能商業(yè)獎(jiǎng)。

GPU加速推理運(yùn)行速度

金融服務(wù)公司Square的測(cè)試結(jié)果顯示,一般模型的推理任務(wù)在GPU上的運(yùn)行速度是CPU的兩倍,而在大型模型(例如RoBERTa)上,推理工作的完成速度提升了10倍。

因此,NVIDIA GPU對(duì)于其實(shí)現(xiàn)將Square Assistant從虛擬調(diào)度程序擴(kuò)展到驅(qū)動(dòng)公司所有產(chǎn)品的對(duì)話式AI引擎的目標(biāo)至關(guān)重要。

寶馬集團(tuán)近期宣布將使用NVIDIA Isaac機(jī)器人平臺(tái)開(kāi)發(fā)五種新型機(jī)器人,以增強(qiáng)其汽車制造廠的物流水平。其中一款由NVIDIA Jetson AGX Xavier支持的機(jī)器人可以每秒執(zhí)行多達(dá)32萬(wàn)億次操作,以執(zhí)行諸如感知、姿勢(shì)估計(jì)和路徑規(guī)劃之類的計(jì)算機(jī)視覺(jué)任務(wù)。

AI推理也在汽車內(nèi)部發(fā)生。中國(guó)的小鵬汽車于4月下旬推出了P7純電動(dòng)轎車,它使用NVIDIA DRIVE AGX Xavier通過(guò)推理傳感器的數(shù)據(jù)以幫助實(shí)現(xiàn)3級(jí)自動(dòng)駕駛功能。

過(guò)去三年來(lái),NVIDIA數(shù)據(jù)中心平臺(tái)的推理性能提高了近50倍,這在很大程度上要?dú)w功于Tensor Core的引入以及TensorRT中正在進(jìn)行的軟件優(yōu)化以及PyTorch和TensorFlow等AI框架的提速。

來(lái)自世界各地的醫(yī)學(xué)專家在2020年GPU技術(shù)大會(huì)(GTC)上就放射、基因組學(xué)、顯微學(xué)和其他醫(yī)療保健領(lǐng)域的AI應(yīng)用進(jìn)行了數(shù)十次演講。在一次演講中,美國(guó)放射學(xué)院主席杰拉爾丁·麥金提(Geraldine McGinty)將AI稱為同時(shí)達(dá)成提高醫(yī)療質(zhì)量和降低成本的“千載難逢的機(jī)會(huì)”。

在農(nóng)業(yè)領(lǐng)域,越來(lái)越多的初創(chuàng)公司正在使用AI來(lái)提高效率。例如,NVIDIA 初創(chuàng)加速計(jì)劃會(huì)員Rabbit Tractors通過(guò)在多功能機(jī)器人上使用Jetson Nano模塊,從攝像頭和雷達(dá)數(shù)據(jù)中推斷出需要進(jìn)行播種、澆水或收獲作物的位置。

還有其他公司也在通過(guò)GPU加速推理,其中包括美國(guó)運(yùn)通的欺詐檢測(cè)、寶潔的工業(yè)檢查以及網(wǎng)絡(luò)巨頭的搜索引擎。

AI推理在NVIDIA DGX A100 GPU上的增益高達(dá)7倍

GPU推理的潛力在不斷上升,準(zhǔn)確性不斷提高。

借助多實(shí)例GPU功能,NVIDIA Ampere架構(gòu)將推理速度提高了7倍。A100 GPU中支持深度神經(jīng)網(wǎng)絡(luò)中稀疏性的新方法有望帶來(lái)更多收益。這是在A100 GPU的技術(shù)概述中討論的架構(gòu)的幾個(gè)新功能之一。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4733

    瀏覽量

    100415
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4855

    瀏覽量

    102709
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46652

    瀏覽量

    237071

原文標(biāo)題:NVIDIA GPU加速AI推理洞察,推動(dòng)跨行業(yè)創(chuàng)新

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    華為AI解決方案加速超寬帶產(chǎn)業(yè)創(chuàng)新

    在華為UBBF 2024第十屆全球超寬帶高峰論壇期間,華為常務(wù)董事、ICT基礎(chǔ)設(shè)施業(yè)務(wù)管理委員會(huì)主任汪濤發(fā)表了“AI加速超寬帶產(chǎn)業(yè)創(chuàng)新,共贏商業(yè)新增長(zhǎng)”主題演講,分享對(duì)AI
    的頭像 發(fā)表于 11-01 15:03 ?186次閱讀

    FPGA和ASIC在大模型推理加速中的應(yīng)用

    隨著現(xiàn)在AI的快速發(fā)展,使用FPGA和ASIC進(jìn)行推理加速的研究也越來(lái)越多,從目前的市場(chǎng)來(lái)說(shuō),有些公司已經(jīng)有了專門做推理的ASIC,像Groq的LPU,專門針對(duì)大語(yǔ)言模型的
    的頭像 發(fā)表于 10-29 14:12 ?152次閱讀
    FPGA和ASIC在大模型<b class='flag-5'>推理</b><b class='flag-5'>加速</b>中的應(yīng)用

    NVIDIA助力麗蟾科技打造AI訓(xùn)練與推理加速解決方案

    麗蟾科技通過(guò) Leaper 資源管理平臺(tái)集成 NVIDIA AI Enterprise,為企業(yè)和科研機(jī)構(gòu)提供了一套高效、靈活的 AI 訓(xùn)練與推理加速
    的頭像 發(fā)表于 10-27 10:03 ?141次閱讀
    <b class='flag-5'>NVIDIA</b>助力麗蟾科技打造<b class='flag-5'>AI</b>訓(xùn)練與<b class='flag-5'>推理</b><b class='flag-5'>加速</b>解決方案

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

    ,無(wú)疑為讀者鋪設(shè)了一條探索人工智能(AI)如何深刻影響并推動(dòng)科學(xué)創(chuàng)新的道路。在閱讀這一章后,我深刻感受到了人工智能技術(shù)在科學(xué)領(lǐng)域的廣泛應(yīng)用潛力以及其帶來(lái)的革命性變化,以下是我個(gè)人的學(xué)習(xí)心得: 1.
    發(fā)表于 10-14 09:12

    NVIDIA與思科合作打造企業(yè)級(jí)生成式AI基礎(chǔ)設(shè)施

    NVIDIA 加速計(jì)算平臺(tái)、NVIDIA AI Enterprise 軟件和 NVIDIA NIM
    的頭像 發(fā)表于 10-10 09:35 ?249次閱讀

    NVIDIA加速計(jì)算和生成式AI領(lǐng)域的創(chuàng)新

    在最新發(fā)布的公司 2024 財(cái)年可持續(xù)發(fā)展報(bào)告開(kāi)篇的一封信中,NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛介紹了 NVIDIA加速計(jì)算和生成式 AI 領(lǐng)域的
    的頭像 發(fā)表于 09-09 09:18 ?476次閱讀

    英偉達(dá)推出全新NVIDIA AI Foundry服務(wù)和NVIDIA NIM推理微服務(wù)

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務(wù)和 NVIDIA NIM 推理微服務(wù),與同樣剛推出的 Llama 3.1
    的頭像 發(fā)表于 07-25 09:48 ?643次閱讀

    進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級(jí)芯片

    ,推理能力提升 15 倍 GB200由兩個(gè)B200Blackwell GPU和一個(gè)基于Arm的Grace CPU組成,采用[臺(tái)積電]4納米工藝制程,共有2080億個(gè)[晶體管],其AI性能為每秒20
    發(fā)表于 05-13 17:16

    NVIDIA加速微軟最新的Phi-3 Mini開(kāi)源語(yǔ)言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開(kāi)源語(yǔ)言模型。TensorRT-LLM 是一個(gè)開(kāi)源庫(kù),用于優(yōu)化從 PC 到云端的 NVID
    的頭像 發(fā)表于 04-28 10:36 ?462次閱讀

    利用NVIDIA組件提升GPU推理的吞吐

    本實(shí)踐中,唯品會(huì) AI 平臺(tái)與 NVIDIA 團(tuán)隊(duì)合作,結(jié)合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將
    的頭像 發(fā)表于 04-20 09:39 ?614次閱讀

    NVIDIA的專用AI平臺(tái)如何推動(dòng)下一代醫(yī)療健康行業(yè)的發(fā)展

    醫(yī)療科技創(chuàng)新企業(yè)在 GTC 上介紹了 NVIDIA 的專用 AI 平臺(tái)如何推動(dòng)下一代醫(yī)療健康行業(yè)的發(fā)展。
    的頭像 發(fā)表于 04-09 10:10 ?1226次閱讀

    使用NVIDIA Triton推理服務(wù)器來(lái)加速AI預(yù)測(cè)

    這家云計(jì)算巨頭的計(jì)算機(jī)視覺(jué)和數(shù)據(jù)科學(xué)服務(wù)使用 NVIDIA Triton 推理服務(wù)器來(lái)加速 AI 預(yù)測(cè)。
    的頭像 發(fā)表于 02-29 14:04 ?532次閱讀

    運(yùn)營(yíng)商持續(xù)深化雙向賦能 跨行業(yè)共建共享擴(kuò)大基建價(jià)值

    實(shí)施電信基礎(chǔ)設(shè)施跨行業(yè)共建共享,推進(jìn)社會(huì)各行業(yè)資源雙向開(kāi)放共享和融合創(chuàng)新應(yīng)用,一方面能夠加速“雙千兆”網(wǎng)絡(luò)建設(shè),進(jìn)而加強(qiáng)賦能各行業(yè)數(shù)字化發(fā)展
    的頭像 發(fā)表于 01-09 17:10 ?628次閱讀

    NVIDIA 初創(chuàng)加速計(jì)劃 Omniverse 加速營(yíng)

    新的 AI 技術(shù)和迅速發(fā)展的應(yīng)用正在改變各行各業(yè),生成式 AI 已經(jīng)展示出在藝術(shù)、設(shè)計(jì)、影視動(dòng)畫(huà)、互娛、建筑等領(lǐng)域加速內(nèi)容創(chuàng)作的價(jià)值,助力實(shí)現(xiàn)高質(zhì)量、高效率、多樣化的內(nèi)容生產(chǎn),成為推動(dòng)
    的頭像 發(fā)表于 12-04 20:35 ?607次閱讀
    <b class='flag-5'>NVIDIA</b> 初創(chuàng)<b class='flag-5'>加速</b>計(jì)劃 Omniverse <b class='flag-5'>加速</b>營(yíng)

    創(chuàng)新企業(yè)云福利:騰訊云 × NVIDIA 初創(chuàng)加速計(jì)劃

    助力生成式 AI、大模型訓(xùn)練與推理、自動(dòng)駕駛、圖像處理等場(chǎng)景初創(chuàng)企業(yè)加速成長(zhǎng),最高獲贈(zèng) 10 萬(wàn)元扶持基金、NVIDIA 深度學(xué)習(xí)培訓(xùn)中心(DLI)優(yōu)惠課程,以及免費(fèi)的
    的頭像 發(fā)表于 11-13 20:40 ?545次閱讀
    <b class='flag-5'>創(chuàng)新</b>企業(yè)云福利:騰訊云 × <b class='flag-5'>NVIDIA</b> 初創(chuàng)<b class='flag-5'>加速</b>計(jì)劃