0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

Knight Rider采用GAN模型:AI和NVIDIA Omniverse為KITT帶來活力

西西 ? 來源:廠商供稿 ? 作者:NVIDIA ? 2021-04-23 14:02 ? 次閱讀

NVIDIA 研究院的最新模型基于 GAN,將 2D 圖像轉化為3D,面向游戲開發(fā)者、藝術家、設計師和建筑師

NVIDIA 研究院 正在研發(fā)一種全新深度學習引擎,該引擎可以根據(jù)標準的 2D 圖像來創(chuàng)建 3D模型,并可以在 NVIDIA Omniverse 中,為諸如由Knight Rider 的 AI 驅(qū)動的 KITT 等標志性汽車帶來活力。

由多倫多的 NVIDIA AI 研究實驗室開發(fā)的 GANverse3D 應用將平面圖像放大成逼真的 3D 模型,可以在虛擬環(huán)境中可視化和控制。這種性能可以幫助建筑師、創(chuàng)作者、游戲開發(fā)人員和設計師輕松地將新對象添加到他們的實體模型中,而不需要 3D 建模方面的專業(yè)知識,也不需要在渲染上花費大量預算。

例如,單張汽車照片可以轉換為3D模型,該模型可以在虛擬場景中行駛,并配有逼真的前燈、尾燈和轉向燈。

為了生成訓練數(shù)據(jù)集,研究人員利用生成性對抗網(wǎng)絡 ——GAN合成圖像,從多個角度描繪同一物體 — 就像攝影師繞著一輛停著的汽車走動,從不同的角度拍攝。這些多視圖圖像被插入到逆圖形的渲染框架中,逆圖形是從 2D 圖像推斷 3D 網(wǎng)格模型的過程。

一旦完成了多視圖圖像訓練,GANverse3D 只需要一個 2D 圖像即可預測 3D 網(wǎng)格模型。該模型可以與 3D 神經(jīng)渲染器一起使用,使開發(fā)人員能夠自定義對象和交換背景。

當作為 NVIDIA Omniverse 平臺的擴展導入并在 NVIDIA RTX GPU 上運行時,GANverse3D 可將任何 2D 圖像重建為 3D,就像流行的 20 世紀 80 年代 Knight Rider 電視節(jié)目中備受喜愛的打擊犯罪的汽車 KITT 一樣。

以前的逆圖形模型依賴于 3D 圖形作為訓練數(shù)據(jù)。

相反,在沒有 3D 要素的幫助下,“我們把 GAN 模型變成了一個非常高效的數(shù)據(jù)生成器,這樣我們就可以基于網(wǎng)絡上的任何 2D 圖像創(chuàng)建出 3D 對象?!盢VIDIA 的研究科學家、該項目的主要作者 Wenzheng Chen 說。

“因為我們是根據(jù)真實圖像而不是合成數(shù)據(jù)進行訓練的,所以 AI 模型能更好地推廣到現(xiàn)實世界的應用中。”該項目的作者、NVIDIA 研究員 Jun Gao 表示。

GANverse3D 背后的研究將在兩個即將召開的會議上發(fā)表:5 月份的ICLR和 6 月份的CVPR。

從爆胎到賽車 KITT

游戲、架構和設計領域的創(chuàng)作者依賴于虛擬環(huán)境,例如 NVIDIA Omniverse 模擬和協(xié)作平臺,在創(chuàng)建最終產(chǎn)品之前測試新的想法并可視化原型。借助 Omniverse Connectors,開發(fā)人員可以在 Omniverse 中使用他們首選的 3D 應用程序,通過實時光線跟蹤來模擬復雜的虛擬世界。

但并不是每個創(chuàng)作者都有時間和資源為他們所繪制的每一個對象創(chuàng)建 3D 模型。若要渲染展廳的汽車,或一條街的建筑,需捕獲所需數(shù)量的多視圖圖像,成本可能高得令人望而卻步。

在這方面,訓練好的 GANverse3D 應用可以用來將汽車、建筑甚至一匹馬的標準圖像轉換成可以在 Omniverse 中自定義和制作動畫的 3D 圖形。

為了重建 KITT,研究人員只需給訓練好的模型輸入汽車的圖像,讓 GANverse3D 預測相應的 3D 紋理網(wǎng)格,以及車輛的不同部分,例如車輪和前照燈。然后,他們使用 NVIDIA Omniverse 套件和 NVIDIA PhysX 工具將預測的紋理轉換成高質(zhì)量的材料,使 KITT 具有更真實的外觀和感覺,并將其與其他汽車一起放置在動態(tài)駕駛序列中。

“Omniverse 讓研究人員能夠?qū)⒓尤诵牡那把匮芯恐苯訋Ыo創(chuàng)作者和最終用戶。”NVIDIA 深度學習工程師 Jean-Francois Lafleche 說道?!白鳛?Omniverse 的擴展,GANverse3D 將幫助藝術家為游戲開發(fā)、城市規(guī)劃甚至訓練新的機器學習模型創(chuàng)建更豐富的虛擬世界?!?/p>

GAN 推動維度轉變

因為從不同角度捕捉同一物體的真實數(shù)據(jù)集很少,所以大多數(shù)將圖像從 2D 轉換為 3D 的 AI 工具都是使用像 ShapeNet 這樣的合成 3D 數(shù)據(jù)集進行訓練的。

為了從現(xiàn)實世界的數(shù)據(jù)中獲得多視圖圖像,例如網(wǎng)上公開的汽車圖像,NVIDIA 研究人員轉而使用GAN 模型,修改其神經(jīng)網(wǎng)絡層,將其轉化為數(shù)據(jù)生成器。

該團隊發(fā)現(xiàn),僅訓練神經(jīng)網(wǎng)絡的前4層,凍結剩余的 12 層參數(shù),可以讓 GAN 從不同的角度渲染同一對象的圖像。

保持前4層參數(shù)凍結,其他 12 層可變,可以讓神經(jīng)網(wǎng)絡基于同一角度生成不同的圖像。通過手動分配標準角度,在特定高度和距離拍攝車輛照片,研究人員可以從單個 2D 圖像快速生成多視圖數(shù)據(jù)集。

最終的模型,在 55000 張由 GAN 生成的汽車圖像上訓練而得,優(yōu)于在流行的 Pascal3D 數(shù)據(jù)集上訓練的逆圖形網(wǎng)絡。

請閱讀由 Wenzheng Chen、NVIDIA 研究員 Jun Gao 和 Huan Ling、NVIDIA 多倫多研究室主任Sanja Fidler、滑鐵盧大學學生 Yuxuan Zhang、斯坦福大學學生 Yinan Zhang 和 MIT 教授 Antonio Torralba 撰寫的 ICLR 論文全文。CVPR 論文的其他合作者包括 Jean-Francois Lafleche、NVIDIA 研究員 Kangxue Yin 和 Adela Barriuso。

NVIDIA 研究團隊在全球擁有超過 200 名科學家,專注于人工智能、計算機視覺自動駕駛汽車、機器人和圖形等領域。GTC上,NVIDIA 首席執(zhí)行官黃仁勛發(fā)表主題演講,讓大家了解更多關于NVIDIA的最新研究和行業(yè)突破。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4717

    瀏覽量

    100009
  • NVIDIA
    +關注

    關注

    14

    文章

    4793

    瀏覽量

    102429
  • AI
    AI
    +關注

    關注

    87

    文章

    28877

    瀏覽量

    266227
  • 3D建模
    +關注

    關注

    0

    文章

    34

    瀏覽量

    9743
  • 深度學習
    +關注

    關注

    73

    文章

    5422

    瀏覽量

    120593
收藏 人收藏

    評論

    相關推薦

    NVIDIAAI城市挑戰(zhàn)賽構建合成數(shù)據(jù)集

    在一年一度的 AI 城市挑戰(zhàn)賽中,來自世界各地的數(shù)百支參賽隊伍在 NVIDIA Omniverse 生成的基于物理學的數(shù)據(jù)集上測試了他們的 AI
    的頭像 發(fā)表于 09-09 10:04 ?304次閱讀

    NVIDIA AI Foundry 全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型

    借助 NVIDIA AI Foundry,企業(yè)和各國現(xiàn)在能夠使用自有數(shù)據(jù)與 Llama 3.1 405B 和 NVIDIA Nemotron 模型配對,來構建“超級
    發(fā)表于 07-24 09:39 ?623次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Foundry <b class='flag-5'>為</b>全球企業(yè)打造自定義 Llama 3.1 生成式 <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>

    NVIDIA發(fā)布Omniverse微服務,物理AI提供超強助力

    NVIDIA Omniverse Cloud Sensor RTX生成用于加速自動駕駛汽車、機械臂、移動機器人、人形機器人和智能空間AI開發(fā)工作的合成數(shù)據(jù) ? CVPR— NVIDIA
    發(fā)表于 06-18 16:35 ?461次閱讀
    <b class='flag-5'>NVIDIA</b>發(fā)布<b class='flag-5'>Omniverse</b>微服務,<b class='flag-5'>為</b>物理<b class='flag-5'>AI</b>提供超強助力

    NVIDIA Omniverse 將為全新 OpenPBR 材質(zhì)模型提供原生支持

    、組合、模擬和協(xié)作的可擴展框架和生態(tài)系統(tǒng),OpenUSD 使開發(fā)者能夠構建可互操作的 3D 工作流,開啟了工業(yè)數(shù)字化的新時代。 此外,NVIDIA Omniverse 還將為全新 OpenPBR 材質(zhì)模型
    的頭像 發(fā)表于 06-14 11:23 ?426次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Omniverse</b> 將為全新 OpenPBR 材質(zhì)<b class='flag-5'>模型</b>提供原生支持

    電子制造商采用NVIDIA AIOmniverse助力工廠提高運營效率并降低成本

    、NVIDIA Omniverse 基于物理學的渲染與模擬以及 NVIDIA Isaac AI 機器人開發(fā)與部署。 通過使用該工作流構建數(shù)字孿生以實時模擬不同工廠布局,制造商無須進行昂
    的頭像 發(fā)表于 06-04 10:22 ?504次閱讀

    Omniverse教程(12):NVIDIA Omniverse USD Presenter的基礎應用

    如前所述,NVIDIA Omniverse? 是一個參考開發(fā)平臺,通過模塊化的開發(fā)框架能夠輕松擴展和自定義。
    的頭像 發(fā)表于 05-20 10:09 ?458次閱讀
    <b class='flag-5'>Omniverse</b>教程(12):<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Omniverse</b> USD Presenter的基礎應用

    NVIDIA Omniverse USD Composer能用來做什么?如何獲取呢?

    NVIDIA Omniverse? USD Composer(以前稱為 Create)是 NVIDIA Omniverse? 中用于構建虛擬世界的參考應用程序,允許用戶進行組裝、模擬和
    的頭像 發(fā)表于 05-20 10:07 ?541次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Omniverse</b> USD Composer能用來做什么?如何獲取呢?

    NVIDIA Omniverse使用Apple Vision Pro拓展世界

    在最新一屆的GTC大會上,NVIDIA宣布了一項革命性的技術突破——全新Omniverse Cloud API的推出。這一創(chuàng)新性的應用編程接口,使得開發(fā)者能夠?qū)⒔换ナ降墓I(yè)數(shù)字孿生無縫流式傳輸至Apple Vision Pro中,
    的頭像 發(fā)表于 03-27 10:36 ?309次閱讀

    全新NVIDIA Omniverse Cloud API有何亮點?

    NVIDIA Omniverse Cloud API 使開發(fā)者能夠?qū)?Omniverse 技術集成到其設計與仿真工具和工作流中。
    的頭像 發(fā)表于 03-20 13:42 ?360次閱讀

    NVIDIA宣布將以API形式提供Omniverse? Cloud

    NVIDIA Omniverse Cloud API 使開發(fā)者能夠?qū)?Omniverse 技術集成到其設計與仿真工具和工作流中。
    的頭像 發(fā)表于 03-20 09:45 ?345次閱讀

    NVIDIA發(fā)布Omniverse Cloud API,眾多工業(yè)數(shù)字孿生軟件工具提供助力

    Ansys、Cadence、Hexagon、微軟、羅克韋爾自動化、西門子、Trimble采用Omniverse技術幫助客戶設計、模擬、構建和運行符合物理學的數(shù)字孿生 ? ? NVIDIA
    發(fā)表于 03-19 09:40 ?342次閱讀
    <b class='flag-5'>NVIDIA</b>發(fā)布<b class='flag-5'>Omniverse</b> Cloud API,<b class='flag-5'>為</b>眾多工業(yè)數(shù)字孿生軟件工具提供助力

    NVIDIA Omniverse中的物理模擬功能

    NVIDIA Omniverse? Simulation 作為 NVIDIA Omniverse? 平臺的關鍵組件之一,由 NVIDIA
    的頭像 發(fā)表于 03-08 11:30 ?771次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Omniverse</b>中的物理模擬功能

    NVIDIA 初創(chuàng)加速計劃 Omniverse 加速營

    的重要力量?;?NVIDIA 全棧式 AI 計算平臺和 Omniverse TM 平臺上的生成式 AI 創(chuàng)作實踐,讓企業(yè)、開發(fā)者能夠了解可落地的生成式
    的頭像 發(fā)表于 12-04 20:35 ?539次閱讀
    <b class='flag-5'>NVIDIA</b> 初創(chuàng)加速計劃 <b class='flag-5'>Omniverse</b> 加速營

    NVIDIA 知乎精彩問答甄選 | 查看關于 NVIDIA Omniverse 的相關精彩問答

    NVIDIA 帶來知乎精彩問答甄選系列,將為您精選知乎上有關 NVIDIA 產(chǎn)品的精彩問答。 本期問答甄選第十八期 ——? 查看關于?NVIDIA
    的頭像 發(fā)表于 12-01 18:40 ?364次閱讀
    <b class='flag-5'>NVIDIA</b> 知乎精彩問答甄選 | 查看關于 <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Omniverse</b> 的相關精彩問答

    Dropbox 與 NVIDIA 攜手數(shù)百萬客戶帶來個性化的生成式 AI

    Dropbox 計劃使用 NVIDIAAI Foundry 構建自定義模型,并通過 Dropbox Dash 通用搜索工具和 Dropbox AI 改進
    的頭像 發(fā)表于 11-20 20:55 ?456次閱讀
    Dropbox 與 <b class='flag-5'>NVIDIA</b> 攜手<b class='flag-5'>為</b>數(shù)百萬客戶<b class='flag-5'>帶來</b>個性化的生成式 <b class='flag-5'>AI</b>