0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

研究人員提出通過(guò)機(jī)器學(xué)習(xí)管道實(shí)現(xiàn)實(shí)時(shí)CG渲染

Dbwd_Imgtec ? 來(lái)源:新智元 ? 作者:新智元 ? 2021-05-10 10:19 ? 次閱讀

神經(jīng)輻射場(chǎng)(NeRF)這一技術(shù)能夠創(chuàng)建人工智能生成的三維環(huán)境和三維物體。但這種新的圖像合成技術(shù)需要大量的訓(xùn)練時(shí)間,并且缺乏實(shí)現(xiàn)實(shí)時(shí)、高度響應(yīng)接口的實(shí)現(xiàn)。然而,企業(yè)和學(xué)術(shù)界之為這一挑戰(zhàn)提供了新的思路——新視圖合成 (NVS)。

近日,一篇題為Neural Lumigraph Rendering的研究論文聲稱,它對(duì)現(xiàn)有的2個(gè)數(shù)量級(jí)圖像進(jìn)行了改進(jìn),展示了通過(guò)機(jī)器學(xué)習(xí)管道實(shí)現(xiàn)實(shí)時(shí) CG 渲染的幾個(gè)步驟。與以前的方法相比,神經(jīng)光圖渲染提供了更好的混合偽像分辨率,并改進(jìn)了遮擋的處理。除了斯坦福大學(xué)(Stanford University)和全息顯示技術(shù)公司 Raxium 的研究人員,這篇論文的貢獻(xiàn)者還包括谷歌首席機(jī)器學(xué)習(xí)架構(gòu)師、 Adobe 的計(jì)算機(jī)科學(xué)家,以及 StoryFile 的首席技術(shù)官。體積捕獲的原理是拍攝主題的靜態(tài)圖像或視頻,并使用機(jī)器學(xué)習(xí)來(lái)「填充」原始文檔未涵蓋的觀點(diǎn)的想法。

上圖取自 Facebook AI 的 2019 AI 研究 ,可以看出體積捕獲的四個(gè)階段:

多個(gè)攝像機(jī)獲取圖像/畫(huà)面;

編碼器/解碼器架構(gòu)(或其他架構(gòu))計(jì)算并連接視圖的相關(guān)性;

射線行進(jìn)算法計(jì)算空間中每個(gè)點(diǎn)的體素(或其他 XYZ 空間幾何單位) ;

訓(xùn)練合成一個(gè)完整的實(shí)體,可以實(shí)時(shí)操作。

到目前為止,正是這種數(shù)據(jù)量大的訓(xùn)練階段使得新視圖合成超出了實(shí)時(shí)或高響應(yīng)捕獲的范疇。事實(shí)上,新視圖合成制作了一個(gè)完整3D地圖的體積空間,意味著它是把這些點(diǎn)縫合到一個(gè)傳統(tǒng)的計(jì)算機(jī)生成的網(wǎng)格,有效地捕捉和連接一個(gè)實(shí)時(shí)CGI 角色。使用 NeRF 的方法依靠點(diǎn)云和深度圖在捕獲設(shè)備的稀疏視點(diǎn)之間生成插值。盡管 NeRF 能夠計(jì)算網(wǎng)格,但大多數(shù)并不使用它來(lái)生成體積場(chǎng)景。相比之下,魏茨曼科學(xué)研究所(Weizmann Institute of Science)在2020年10月發(fā)布的隱式可區(qū)分渲染(IDR)方法,取決于利用從捕獲數(shù)組自動(dòng)生成的3D網(wǎng)格信息。雖然 NeRF 缺乏 IDR 的形狀估計(jì)能力,IDR無(wú)法比擬的nerf的圖像質(zhì)量,而且兩者都需要大量的資源來(lái)訓(xùn)練和整理。NLR的Custom相機(jī)裝置具有16臺(tái)GoPro HERO7和6臺(tái)中央Back-Bone H7PRO相機(jī)。對(duì)于實(shí)時(shí)渲染,它們的最低運(yùn)行速度為60fps。

相反,神經(jīng)光圖渲染利用 SIREN (正弦表示網(wǎng)絡(luò))將每種方法的優(yōu)點(diǎn)整合到它自己的框架中,目的是生成直接可用于現(xiàn)有實(shí)時(shí)圖形管道的輸出。在過(guò)去一年中,SIREN 已被用于類似場(chǎng)景,現(xiàn)在是圖像合成社區(qū)中業(yè)余愛(ài)好者 Colabs 的一個(gè)流行的 API 調(diào)用。然而,NLR 的創(chuàng)新是將 SIREN 應(yīng)用于二維多視圖圖像監(jiān)控。從陣列圖像中提取 CG 網(wǎng)格后,通過(guò) OpenGL 對(duì)網(wǎng)格進(jìn)行柵格化,將網(wǎng)格的頂點(diǎn)位置映射到適當(dāng)?shù)南袼攸c(diǎn),然后計(jì)算各種貢獻(xiàn)圖的融合。結(jié)果得到的網(wǎng)格比 NeRF 的網(wǎng)格更加具有代表性,需要更少的計(jì)算,并且不會(huì)將過(guò)多的細(xì)節(jié)應(yīng)用到不能從中受益的區(qū)域(如光滑的面部皮膚) 。

另一方面,NLR 還沒(méi)有任何動(dòng)態(tài)照明或重點(diǎn)照明的能力,輸出僅限于陰影地圖和其他照明時(shí)獲得的信息。研究人員打算在未來(lái)的工作中解決這個(gè)問(wèn)題。此外,論文承認(rèn)由 NLR 生成的圖形并不像一些替代方法那樣精確,或者前面提到的魏茨曼科學(xué)研究。利用神經(jīng)網(wǎng)絡(luò)從一系列有限的照片中創(chuàng)建3D實(shí)體的想法早于 NeRF,而相關(guān)研究可以追溯到2007年或更早。在2019年,F(xiàn)acebook 的人工智能研究部門(mén)發(fā)表了一篇開(kāi)創(chuàng)性的研究論文Neural volume: Learning Dynamic Renderable volume from Images),該論文首次為基于機(jī)器學(xué)習(xí)的體積捕獲生成的合成人啟用了響應(yīng)界面。

原文標(biāo)題:做出電影級(jí)的 CG 渲染!斯坦福大學(xué)研究人員提出神經(jīng)光圖渲染

文章出處:【微信公眾號(hào):Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1787

    文章

    46061

    瀏覽量

    234985
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8306

    瀏覽量

    131841

原文標(biāo)題:做出電影級(jí)的 CG 渲染!斯坦福大學(xué)研究人員提出神經(jīng)光圖渲染

文章出處:【微信號(hào):Imgtec,微信公眾號(hào):Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    功率放大器在管道定位系統(tǒng)的硬件實(shí)現(xiàn)研究中的應(yīng)用

    實(shí)驗(yàn)名稱:管道定位系統(tǒng)的硬件實(shí)現(xiàn)實(shí)驗(yàn)內(nèi)容:開(kāi)展基于PCM的管道定位系統(tǒng)的可行性研究:采用函數(shù)發(fā)生器產(chǎn)生4Hz、8Hz和72Hz的多頻電流,并將信號(hào)輸出到AigtekATA-308B功率
    的頭像 發(fā)表于 08-27 14:36 ?125次閱讀
    功率放大器在<b class='flag-5'>管道</b>定位系統(tǒng)的硬件<b class='flag-5'>實(shí)現(xiàn)</b><b class='flag-5'>研究</b>中的應(yīng)用

    vue+spring boot人員定位系統(tǒng)源碼,實(shí)現(xiàn)實(shí)時(shí)定位、智慧調(diào)度、軌跡追蹤

    隨著經(jīng)濟(jì)的高速發(fā)展,現(xiàn)代制造業(yè)生產(chǎn)設(shè)備日益繁多,生產(chǎn)車間面積廣闊,生產(chǎn)工人數(shù)量多,存在難以進(jìn)行有效管理和不便實(shí)施全方位風(fēng)險(xiǎn)管控的難題。定位管理系統(tǒng)通過(guò)在廠區(qū)、車間部署UWB定位基站,實(shí)時(shí)采集人員
    的頭像 發(fā)表于 08-08 14:27 ?236次閱讀
    vue+spring boot<b class='flag-5'>人員</b>定位系統(tǒng)源碼,<b class='flag-5'>實(shí)現(xiàn)實(shí)時(shí)</b>定位、智慧調(diào)度、軌跡追蹤

    基于DOE的管道爬行機(jī)器人輕量化研究

    的效率和可靠性。因此,基于DOE的管道爬行機(jī)器人輕量化研究成為了當(dāng)前研究的熱點(diǎn)之一。 首先,我們需要明確什么是DOE。DOE,即設(shè)計(jì)優(yōu)化實(shí)驗(yàn),是一種基于統(tǒng)計(jì)學(xué)原理的優(yōu)化設(shè)計(jì)方法。
    的頭像 發(fā)表于 06-14 09:33 ?1204次閱讀

    研究人員利用人工智能提升超透鏡相機(jī)的圖像質(zhì)量

    研究人員利用深度學(xué)習(xí)技術(shù)提高了直接集成在 CMOS 成像芯片上的超透鏡相機(jī)(左)的圖像質(zhì)量。超透鏡利用 1000 納米高的圓柱形氮化硅納米柱陣列(右圖)操縱光線。 研究人員利用深度學(xué)習(xí)
    的頭像 發(fā)表于 06-11 06:34 ?235次閱讀
    <b class='flag-5'>研究人員</b>利用人工智能提升超透鏡相機(jī)的圖像質(zhì)量

    【RTC程序設(shè)計(jì):實(shí)時(shí)音視頻權(quán)威指南】音頻采集與渲染

    在進(jìn)行視頻的采集與渲染的同時(shí),我們還需要對(duì)音頻進(jìn)行實(shí)時(shí)的采集和渲染。對(duì)于rtc來(lái)說(shuō),音頻的實(shí)時(shí)性和流暢性更加重要。 聲音是由于物體在空氣中振動(dòng)而產(chǎn)生的壓力波,聲波的存在依賴于空氣介質(zhì),
    發(fā)表于 04-28 21:00

    研究人員發(fā)現(xiàn)提高激光加工分辨率的新方法

    通過(guò)透明玻璃聚焦定制激光束可以在材料內(nèi)部形成一個(gè)小光斑。東北大學(xué)的研究人員研發(fā)了一種利用這種小光斑改進(jìn)激光材料加工、提高加工分辨率的方法。 他們的研究成果發(fā)表在《光學(xué)通訊》(Optics
    的頭像 發(fā)表于 04-18 06:30 ?232次閱讀
    <b class='flag-5'>研究人員</b>發(fā)現(xiàn)提高激光加工分辨率的新方法

    功率放大器在管道定位系統(tǒng)的硬件實(shí)現(xiàn)研究中的應(yīng)用

    實(shí)驗(yàn)名稱:功率放大器在管道定位系統(tǒng)的硬件實(shí)現(xiàn)研究中的應(yīng)用研究方向:管道無(wú)損檢測(cè)實(shí)驗(yàn)設(shè)備:ATA-308C功率放大器,函數(shù)信號(hào)發(fā)生器,數(shù)字萬(wàn)用
    的頭像 發(fā)表于 03-28 08:01 ?212次閱讀
    功率放大器在<b class='flag-5'>管道</b>定位系統(tǒng)的硬件<b class='flag-5'>實(shí)現(xiàn)</b><b class='flag-5'>研究</b>中的應(yīng)用

    揭秘:實(shí)時(shí)渲染、離線渲染、云渲染和混合渲染的區(qū)別

    遇到這些概念,或者一些3D渲染引擎產(chǎn)品的時(shí)候,可以按照這些渲染分類,去快速的進(jìn)行定位和分析,更好的幫助我們理解和學(xué)習(xí)。一、實(shí)時(shí)渲染
    的頭像 發(fā)表于 12-26 08:27 ?588次閱讀
    揭秘:<b class='flag-5'>實(shí)時(shí)</b><b class='flag-5'>渲染</b>、離線<b class='flag-5'>渲染</b>、云<b class='flag-5'>渲染</b>和混合<b class='flag-5'>渲染</b>的區(qū)別

    研究人員創(chuàng)造一種六角形心電圖貼片 實(shí)現(xiàn)遙感與數(shù)據(jù)傳輸功能

    導(dǎo)? ? 語(yǔ)在《Applied Physics Reviews》期刊上,研究人員提出了一種新型可穿戴心電圖貼片,旨在增強(qiáng)床旁診斷,檢測(cè)心血管疾病并幫助評(píng)估整體心臟健康狀況。該研究的重點(diǎn)在于利用有源干
    的頭像 發(fā)表于 12-13 16:44 ?379次閱讀

    實(shí)時(shí)渲染助力VR虛擬現(xiàn)實(shí)邁向成熟

    ,并通過(guò)手柄或手勢(shì)操作進(jìn)行互動(dòng)。 一、 VR虛擬現(xiàn)實(shí)技術(shù) 1、 3D圖形渲染技術(shù) 這是虛擬現(xiàn)實(shí)技術(shù)中至關(guān)重要的組成部分,它能夠高效地呈現(xiàn)虛擬世界中的物體和場(chǎng)景。3D圖形
    的頭像 發(fā)表于 12-08 13:38 ?303次閱讀

    ROS機(jī)器人如何使用Navigation導(dǎo)航包實(shí)現(xiàn)實(shí)時(shí)定位

    本篇文章主要分析,常規(guī)的ROS機(jī)器人是如何使用Navigation導(dǎo)航包實(shí)現(xiàn)實(shí)時(shí)定位的,定位精度的決定性因素等內(nèi)容,結(jié)構(gòu)上分為詳細(xì)介紹、概括總結(jié)、深入思考三大部分。
    的頭像 發(fā)表于 12-03 11:00 ?2277次閱讀
    ROS<b class='flag-5'>機(jī)器</b>人如何使用Navigation導(dǎo)航包<b class='flag-5'>實(shí)現(xiàn)實(shí)時(shí)</b>定位

    AV-HSW10如何通過(guò)帶alpha通道的NDI信號(hào)處理CG素材?

    通過(guò)這個(gè)功能,我們可以實(shí)現(xiàn)直接使用NDI信號(hào)輸入帶透明效果(alpha通道)的CG素材。
    的頭像 發(fā)表于 11-15 10:13 ?644次閱讀
    AV-HSW10如何<b class='flag-5'>通過(guò)</b>帶alpha通道的NDI信號(hào)處理<b class='flag-5'>CG</b>素材?

    谷歌研究人員利用現(xiàn)有的耳機(jī)來(lái)測(cè)量心率

    谷歌的研究人員還發(fā)現(xiàn),當(dāng)音樂(lè)播放時(shí),超聲波方法效果很好,但它在嘈雜的環(huán)境中還可能存在問(wèn)題,“APG信號(hào)有時(shí)會(huì)非常嘈雜,或可受到身體運(yùn)動(dòng)的嚴(yán)重干擾?!比欢?,他們發(fā)現(xiàn),他們可以通過(guò)使用多個(gè)頻率并找出其中最準(zhǔn)確的信號(hào)來(lái)克服運(yùn)動(dòng)問(wèn)題。
    的頭像 發(fā)表于 11-09 16:32 ?552次閱讀

    基于機(jī)器學(xué)習(xí)的應(yīng)用系統(tǒng)指紋識(shí)別技術(shù)研究

    摘要: 在信息安全測(cè)試領(lǐng)域,基于機(jī)器學(xué)習(xí)的應(yīng)用系統(tǒng)深度指紋識(shí)別技術(shù)對(duì)應(yīng)用系統(tǒng)進(jìn)行漏洞檢測(cè)時(shí),可快速獲取應(yīng)用系統(tǒng)指紋信息,并且能夠根據(jù)系統(tǒng)深度指紋信息進(jìn)行精確的自適應(yīng)漏洞檢測(cè)。通過(guò)研究
    的頭像 發(fā)表于 11-03 11:50 ?960次閱讀
    基于<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>的應(yīng)用系統(tǒng)指紋識(shí)別技術(shù)<b class='flag-5'>研究</b>

    神經(jīng)渲染:圖形學(xué)與深度學(xué)習(xí)的完美結(jié)合

    神經(jīng)渲染是一種利用深度學(xué)習(xí)和圖形學(xué)技術(shù),實(shí)現(xiàn)高質(zhì)量、高效率、高靈活性的圖像合成和渲染的方法。神經(jīng)渲染不僅能夠生成逼真的圖像,還能夠?qū)D像進(jìn)行
    的頭像 發(fā)表于 09-23 08:30 ?902次閱讀
    神經(jīng)<b class='flag-5'>渲染</b>:圖形學(xué)與深度<b class='flag-5'>學(xué)習(xí)</b>的完美結(jié)合