0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Aleth-NeRF:低光增強(qiáng)與曝光糾正的新方向!不良光照?qǐng)鼍跋碌男乱暯呛铣?/h1>

大家好,今天要介紹的是AAAI 2024關(guān)于不良光照下NeRF新視角合成的工作Aleth-NeRF,目的在不良光照?qǐng)鼍跋拢ㄈ绲凸庹蘸瓦^曝光)場(chǎng)景,能夠從NeRF無(wú)監(jiān)督增強(qiáng)并且生成正常光照的連貫3D scene。我們提出的方法可以對(duì)現(xiàn)有NeRF進(jìn)行簡(jiǎn)單改進(jìn),通過引入一個(gè)Concealing Field的概念,僅用幾行代碼就可以使得現(xiàn)有的NeRF在低光照或者過曝光的情況下,進(jìn)行Novel View Synthesis重建,并且實(shí)現(xiàn)無(wú)監(jiān)督的低光增強(qiáng)和曝光糾正。

d929d1c2-9f51-11ee-8b88-92fbcf53809c.png

1. 方法概述:

本文提出了Aleth-NeRF模型來完成無(wú)監(jiān)督低光照增強(qiáng)&過曝糾正和Novel View Synthesis。傳統(tǒng)NeRF [1]是以觀察者視角出發(fā),通過設(shè)定當(dāng)前位置光通量的多少來定義物體,缺乏對(duì)于光照和物體的結(jié)構(gòu),無(wú)法解釋光照變換對(duì)場(chǎng)景的影響 [2],所以NeRF無(wú)法應(yīng)用于低光照和過度曝光時(shí)候的重建。非常有趣的是古希臘人也秉持著與NeRF非常接近的世界觀,古希臘人認(rèn)為人的眼睛有一道視線,人們看到物體是來源于視線的累積,看不見物體是因?yàn)榭諝庵写嬖谡趽?。受到古希臘視覺觀點(diǎn)的啟發(fā),我們認(rèn)為在黑夜看不見物體是因?yàn)榭諝庵写嬖谡趽跷镫[蔽場(chǎng)(Concealing Field),女神Aletheia象征著真實(shí)/不隱蔽,在希臘語(yǔ)里意為“真相”,這也是Aleth-NeRF名字的由來。因此我們通過對(duì)NeRF框架做最小改動(dòng),在NeRF模型中引入了隱蔽場(chǎng)的概念,可以用來有效的解釋光照變換,在實(shí)際實(shí)現(xiàn)中只需要加入幾行代碼,不需要復(fù)雜的光照解構(gòu),就可以使得各種NeRF框架擁有同時(shí)處理低光和過曝光的能力,分為兩組隱蔽場(chǎng)(voxel-wise的局部隱蔽場(chǎng),以及global-wise的全局隱蔽場(chǎng))。低光場(chǎng)景下的訓(xùn)練如上圖(c)所示,訓(xùn)練階段隱蔽場(chǎng)會(huì)加入到NeRF的volume rendering中參與訓(xùn)練低光照?qǐng)鼍?,在測(cè)試階段隱蔽場(chǎng)將會(huì)被拿開rendering出正常光照?qǐng)鼍啊_^曝光場(chǎng)景下的訓(xùn)練如上圖(d)所示,訓(xùn)練階段正常,然而測(cè)試階段隱蔽場(chǎng)將會(huì)被加上用來rendering出正常光照?qǐng)鼍?。?duì)于以上兩種場(chǎng)景,我們都會(huì)在訓(xùn)練階段給NeRF網(wǎng)絡(luò)以及隱蔽場(chǎng)加入無(wú)監(jiān)督損失函數(shù)來控制隱蔽場(chǎng)的生成。

2. 模型架構(gòu):

模型的大概結(jié)構(gòu)圖如下所示:

d94191e0-9f51-11ee-8b88-92fbcf53809c.png

以最經(jīng)典的原始NeRF為例,局部隱蔽場(chǎng)通過NeRF的MLP網(wǎng)絡(luò)產(chǎn)生,與原始NeRF的兩個(gè)輸出color和density相同,屬于voxel-wise,全局隱蔽場(chǎng)則是一組可學(xué)習(xí)的網(wǎng)絡(luò)參數(shù),在每個(gè)場(chǎng)景下固定,屬于global-wise,兩組隱蔽場(chǎng)共同加入Volume Rendering中來衰退原有NeRF的Volume Rendering,通過Concealing Field的引入,Volume Rendering中的每個(gè)粒子受到前面粒子的遮蔽作用加強(qiáng),我們通過Concealing Field這一假設(shè)來模擬黑暗的產(chǎn)生。與此同時(shí),訓(xùn)練階段我們也通過添加各種無(wú)監(jiān)督損失函數(shù)來約束Concealing Field的生成,幫助我們更好的增強(qiáng)和修復(fù)不良光照?qǐng)鼍?。低光?chǎng)景的訓(xùn)練階段會(huì)采用引入Concealing Field的Volume Rendering公式,在測(cè)試階段采用去掉Concealing Field的原有Volume Rendering公式,過曝場(chǎng)景則與之相反。

d946b5ee-9f51-11ee-8b88-92fbcf53809c.png

經(jīng)過我們的實(shí)驗(yàn)發(fā)現(xiàn), Concealing Field的生成范圍和Volume Rendering中粒子Density的范圍呈反比例關(guān)系,這意味著訓(xùn)練過程中Concealing Field更傾向于出現(xiàn)在沒有物體的地方,與我們對(duì)Concealing Field存在空氣中的假想一致。

3. 損失函數(shù)

為了保障Aleth-NeRF的無(wú)監(jiān)督增強(qiáng)/過曝糾正,我們額外引入了幾個(gè)損失函數(shù)來約束Concealing Fields的生成,首先我們把NeRF原有的MSE損失函數(shù)L_mse變換為L(zhǎng)_it-mse,即在計(jì)算MSE損失之前先把圖像過一個(gè)反向Tone曲線,因?yàn)樵糓SE損失中黑暗像素往往權(quán)重過小而過曝像素往往權(quán)重較大,因此先加一個(gè)反向Tone曲線可以某種程度上做一下平衡。剩余的是三個(gè)無(wú)監(jiān)督損失函數(shù),其中包括控制總體亮度范圍(Enhance Degree)的損失函數(shù)L_de和控制對(duì)比度(Contrast Degree)的損失函數(shù)L_co,以及一個(gè)Color Constancy損失函數(shù)L_cc。通過調(diào)整控制總體亮度損失函數(shù)L_de和控制對(duì)比度損失函數(shù)L_co的超參數(shù),也可以實(shí)現(xiàn)不同程度的增強(qiáng)。

4. 數(shù)據(jù)集:

關(guān)于數(shù)據(jù)集方面,我們提出了一個(gè)成對(duì)的低光照/過曝光/正常光照的multi-view數(shù)據(jù)集(LOM數(shù)據(jù)集),以便大家進(jìn)行后續(xù)研究,低光照和過曝光的圖像用于訓(xùn)練模型,正常光照的圖像用于Novel View Synthesis的驗(yàn)證,相比于2D圖像增強(qiáng)以及視頻增強(qiáng),這一任務(wù)更具挑戰(zhàn)性,因?yàn)樾枰趫D像增強(qiáng)的同時(shí)來確保生成圖像的multi-view一致性,數(shù)據(jù)集圖片如下,我們通過相機(jī)采集了五個(gè)真實(shí)世界的場(chǎng)景 (buu, chair, sofa, bike, shrub),每個(gè)場(chǎng)景都包含有25~65張multi-view圖像,每個(gè)圖像都有三組不同曝光條件(低光照/過曝光/正常光照)。值得一提的是,此前谷歌的RAW-NeRF [3]也提供了一些真實(shí)世界的multi-view低光圖片,但是RAW-NeRF關(guān)注的更多是將ISP與NeRF渲染結(jié)合,利用RAW圖像的廣闊色域和比特?cái)?shù)優(yōu)勢(shì)來進(jìn)行渲染,而并不是RGB圖像增強(qiáng),因此RAW-NeRF也沒有對(duì)應(yīng)正常光照RGB的ground truth。我們提供的LOM數(shù)據(jù)集可以從網(wǎng)站或Github上下載,概覽如下圖示:

d94b1fc6-9f51-11ee-8b88-92fbcf53809c.png

5. 實(shí)驗(yàn)結(jié)果

實(shí)驗(yàn)方面,我們把原始的NeRF模型作為baseline,除此之外我們?cè)倥c現(xiàn)有的2D圖像/視頻增強(qiáng)方法進(jìn)行了對(duì)比,與增強(qiáng)方法進(jìn)行對(duì)比時(shí),我們?cè)O(shè)計(jì)了兩種方式,(1). 第一種是用先在低光/過曝圖像上訓(xùn)練NeRF然后在novel view synthesis階段把2D增強(qiáng)方法用作后處理,(2). 第二種是先用2D圖像/視頻增強(qiáng)方法來預(yù)處理數(shù)據(jù)集,然后在這些增強(qiáng)后的數(shù)據(jù)上訓(xùn)練NeRF。通過實(shí)驗(yàn)我們發(fā)現(xiàn),方式(1)的缺陷在于低質(zhì)量圖像上訓(xùn)練的NeRF本身不夠可靠,導(dǎo)致后處理增強(qiáng)后的結(jié)果也往往不盡如人意,容易出現(xiàn)低分辨率和模糊的情況,方式(2)的缺陷在于2D圖像/視頻增強(qiáng)方法往往不能保證3D multi-view的一致性,因此在不一致圖像上訓(xùn)練的NeRF也會(huì)存在問題。總的來說,Aleth-NeRF這種end-to-end的方法能夠在最終的平均指標(biāo)上取得最優(yōu)效果,在3D的可視化中也能保持多視角的consistency,表格與實(shí)驗(yàn)結(jié)果圖如下。:

d965eea0-9f51-11ee-8b88-92fbcf53809c.png

d96a7c5e-9f51-11ee-8b88-92fbcf53809c.png

6. 缺陷和展望:

雖然Aleth-NeRF在低光和過曝場(chǎng)景實(shí)現(xiàn)了較好的無(wú)監(jiān)督恢復(fù),但是只是這一任務(wù)的初步探索,比如NeRF本身自帶的缺陷如訓(xùn)練慢和場(chǎng)景無(wú)法泛化等,以及Aleth-NeRF還是無(wú)法解決一些非均勻光照?qǐng)鼍芭c陰影場(chǎng)景等,還有在一些場(chǎng)景中,Aleth-NeRF復(fù)原的圖像色彩存在偏差,有些過曝場(chǎng)景的恢復(fù)會(huì)丟失色彩等等。收到古希臘視覺理論,Aleth-NeRF提出了Concealing Fields概念,用一種簡(jiǎn)單直觀的方式來建模黑暗,我們認(rèn)為也許其他不同的黑暗建模方式也能夠取到很好的效果,更有效的低光照建模也許能夠克服Aleth-NeRF的不足。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4284

    瀏覽量

    62325
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3115

    瀏覽量

    48660
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1200

    瀏覽量

    24621

原文標(biāo)題:AAAI 2024 | Aleth-NeRF:低光增強(qiáng)與曝光糾正的新方向!不良光照?qǐng)鼍跋碌男乱暯呛铣?/p>

文章出處:【微信號(hào):CVer,微信公眾號(hào):CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    ADB和毯成車燈內(nèi)卷新方向,DLP芯片迎來重大機(jī)遇

    融合算法,帶來ADB自動(dòng)遮蔽和示寬毯等創(chuàng)新照明功能。 ADB的命名是沒有什么爭(zhēng)議的,不過毯在很多車企那里叫法不同,也有幕和燈幕等稱呼。并且,這些功能已經(jīng)不再是豪華車的配置,逐漸下探到主流車型,成為車企內(nèi)卷
    的頭像 發(fā)表于 03-01 00:20 ?5820次閱讀

    為什么說移動(dòng)終端發(fā)展引領(lǐng)了半導(dǎo)體工藝新方向?

    長(zhǎng)期演進(jìn)(LTE)等4G技術(shù)的發(fā)展,分立技術(shù)在通信領(lǐng)域中正變得越來越少見。事實(shí)上許多人相信,智能手機(jī)的普及敲響了手持通信產(chǎn)品中分立實(shí)現(xiàn)技術(shù)的喪鐘。這也是為什么大家說,移動(dòng)終端發(fā)展引領(lǐng)了半導(dǎo)體工藝新方向。
    發(fā)表于 08-02 08:23

    車用電子是不是無(wú)線藍(lán)牙應(yīng)用的新方向

    車用電子是不是無(wú)線藍(lán)牙應(yīng)用的新方向?無(wú)線藍(lán)牙技術(shù)回音消除及噪聲抑制解決方案
    發(fā)表于 05-14 06:02

    照度圖像增強(qiáng)算法

    針對(duì)照度圖像反轉(zhuǎn)后為與霧天圖像相似的偽霧圖,其霧的濃度由光照情況而非景深決定這一特點(diǎn),提出一種基于物理模型的照度圖像增強(qiáng)算法。該算法根據(jù)光照
    發(fā)表于 01-05 15:19 ?1次下載

    TCL洗衣機(jī)深入把握用戶需求 正引領(lǐng)行業(yè)創(chuàng)新新方向

    當(dāng)下,在房地產(chǎn)拉動(dòng)減弱,消費(fèi)增長(zhǎng)放緩的經(jīng)濟(jì)環(huán)境,中國(guó)家電零售市場(chǎng)呈現(xiàn)“前高后”的發(fā)展趨勢(shì)。洗衣機(jī)產(chǎn)業(yè)也已進(jìn)入存量需求為主導(dǎo)的市場(chǎng)階段,差異化產(chǎn)品成為市場(chǎng)競(jìng)爭(zhēng)的主要途徑。其中,秉承務(wù)實(shí)創(chuàng)新理念的TCL洗衣機(jī)深入把握用戶需求,正引領(lǐng)行業(yè)創(chuàng)新
    發(fā)表于 05-15 09:04 ?984次閱讀

    AI技術(shù)的賦能為城市治理提供新方向

    新冠疫情的突襲為人類帶來了巨大挑戰(zhàn),也為這些年智慧城市發(fā)展治理出了一道難題,在防控過程中暴露出了很多實(shí)際管控出現(xiàn)的問題,但此次疫情AI技術(shù)的賦能也為城市治理提供新方向。
    的頭像 發(fā)表于 11-27 09:54 ?1763次閱讀

    醫(yī)療硬件設(shè)備行業(yè)發(fā)展的新方向

    我們通常都知道醫(yī)療產(chǎn)品有哪些,往往對(duì)于醫(yī)療輔助類產(chǎn)品慨念不明,隨著我國(guó)醫(yī)療應(yīng)用的逐漸認(rèn)可和各診療階段應(yīng)用的普及,醫(yī)用輔助產(chǎn)品已經(jīng)成為醫(yī)療領(lǐng)域的“高需求產(chǎn)品”。智能化是醫(yī)療硬件設(shè)備行業(yè)發(fā)展的新方向。
    的頭像 發(fā)表于 08-14 16:15 ?5904次閱讀

    高端家電下一步該如何持續(xù)發(fā)展,卡薩帝給出新方向

    展同步開啟,卡薩帝鑒賞家套系亮相展會(huì),向“世界設(shè)計(jì)之都”展示了東方美學(xué)藝術(shù)設(shè)計(jì)以及成套嵌入式高端智慧場(chǎng)景方案。這也為未來高端家電持續(xù)發(fā)展提供了兩大新方向:一是藝術(shù)化設(shè)計(jì),二是場(chǎng)景化布局。 設(shè)計(jì)
    的頭像 發(fā)表于 06-07 17:02 ?1081次閱讀

    Block nerf:可縮放的大型場(chǎng)景神經(jīng)視圖合成

    為了在大場(chǎng)景中應(yīng)用神經(jīng)輻射場(chǎng)(NeRF)模型,文章提出將大型場(chǎng)景分解為相互重疊的子場(chǎng)景 (block),每一個(gè)子場(chǎng)景分別訓(xùn)練,在推理時(shí)動(dòng)態(tài)結(jié)
    的頭像 發(fā)表于 10-19 15:15 ?1460次閱讀

    基于BlockNeRF的大場(chǎng)景規(guī)?;窠?jīng)視圖合成

    mip-NeRF 的基礎(chǔ)上增加了外觀嵌入、曝光嵌入和位姿細(xì)化,以解決訓(xùn)練數(shù)據(jù)橫跨數(shù)月而導(dǎo)致的環(huán)境變化和位姿誤差。 為了保證相鄰 Block-NeRF 的無(wú)縫合成,文章提出了在推理時(shí)迭
    的頭像 發(fā)表于 10-19 15:15 ?876次閱讀

    基于深度學(xué)習(xí)的光照增強(qiáng)技術(shù)解析

    訓(xùn)練數(shù)據(jù)采用的是用PS調(diào)整過的高質(zhì)量圖像和對(duì)應(yīng)的合成光照圖像(隨機(jī)減少亮度、對(duì)比度,伽馬校正)。損失函數(shù)為帶正則項(xiàng)的誤差矩陣的F-范數(shù)平方,即誤差平方和。
    發(fā)表于 12-07 11:21 ?911次閱讀

    NeRF的研究目的是合成同一場(chǎng)景不同視角的圖像

    為了順利完成上面過程,我們可能需要維護(hù)碩大無(wú)朋Tensor來表示輻射場(chǎng),查表獲取RGB和密度。這里一個(gè)問題是空間有多大表就有多大,同時(shí)只能是離散表示的。NeRF要做的事情是用一個(gè)神經(jīng)網(wǎng)絡(luò)來建模輻射場(chǎng)
    的頭像 發(fā)表于 01-29 10:54 ?1238次閱讀

    基于通過非常稀疏的視角輸入合成場(chǎng)景的方法

    作者引入了一種方法,可以僅使用單個(gè)寬基線立體圖像對(duì)生成新視角。在這種具有挑戰(zhàn)性的情況,3D場(chǎng)景點(diǎn)只被正常觀察一次,需要基于先驗(yàn)進(jìn)行場(chǎng)景幾何和外觀的重建。作者發(fā)現(xiàn)從稀疏觀測(cè)中生成
    的頭像 發(fā)表于 06-13 09:29 ?653次閱讀
    基于通過非常稀疏的<b class='flag-5'>視角</b>輸入<b class='flag-5'>合成</b><b class='flag-5'>場(chǎng)景</b>的方法

    LED虛擬拍攝:電影制作與電視廣播的新方向

    LED虛擬拍攝:電影制作與電視廣播的新方向 隨著科技的迅速進(jìn)步,LED虛擬拍攝逐漸成為電影制作和電視廣播的新方向。這種新型的拍攝方式借助一系列先進(jìn)的技術(shù),如XR虛擬拍攝和LED巨幕,為創(chuàng)作者提供了
    的頭像 發(fā)表于 08-25 16:28 ?386次閱讀

    利用PyTorch實(shí)現(xiàn)NeRF代碼詳解

    神經(jīng)輻射場(chǎng)(NeRF)是一種利用神經(jīng)網(wǎng)絡(luò)來表示和渲染復(fù)雜的三維場(chǎng)景的方法。它可以從一組二維圖片中學(xué)習(xí)出一個(gè)連續(xù)的三維函數(shù),這個(gè)函數(shù)可以給出空間中任意位置和方向上的顏色和密度。通過體積渲染的技術(shù),
    的頭像 發(fā)表于 10-21 09:46 ?702次閱讀