KIRI Innovations是一家面向全球市場(chǎng)的 AI 公司,致力于通過(guò)前沿技術(shù)賦能 3D 內(nèi)容制作,降低 3D 內(nèi)容生產(chǎn)的門檻。公司擁有 3D 重建引擎 KIRI Engine,通過(guò)手機(jī)拍照即可實(shí)現(xiàn)對(duì)物體的超寫實(shí) 3D 建模。
KIRI Engine 生成的 3D 模型素材 擁有逼真的紋理材質(zhì)信息 上線短短幾個(gè)月的時(shí)間內(nèi),KIRI Engine 全球用戶已突破 30 萬(wàn)人,且還在快速增長(zhǎng)中,其中包括 Google、Roblox、EA、Epic Games、Meta 等元宇宙企業(yè)用戶。用戶通過(guò) KIRI Engine App 或 KIRI Engine 網(wǎng)頁(yè)端將圍繞物體拍攝的照片上傳至云端進(jìn)行處理,就可以獲得和現(xiàn)實(shí)物體一模一樣的 3D 模型素材,再將這些逼真的 3D 模型素材應(yīng)用在各種包括 VR 場(chǎng)景、3D 游戲、影視特效在內(nèi)的 3D 內(nèi)容制作中。
用戶使用 KIRI Engine 生成的 3D 模型 出現(xiàn)在各種 3D 游戲、VR 場(chǎng)景,甚至影視作品中 KIRI Engine 的背后,是一套部署在云端的神經(jīng)網(wǎng)絡(luò)重建算法,能夠通過(guò)多角度照片集或視頻,對(duì)現(xiàn)實(shí)物體生成具有紋理材質(zhì)信息和幾何信息的超寫實(shí) 3D 模型。這種重建算法的計(jì)算量非常巨大,使用傳統(tǒng)解決方案意味著消耗大量的算力資源和成本。KIRI Engine 使用NVIDIAGPU在云端進(jìn)行計(jì)算,一片 GPU 負(fù)責(zé)進(jìn)行復(fù)雜的神經(jīng)網(wǎng)絡(luò)訓(xùn)練,另一片 GPU 則負(fù)責(zé)模型推理,將訓(xùn)練好的模型移至這片 GPU 主機(jī)上,通過(guò)輸入新的數(shù)據(jù)來(lái)獲得想要的結(jié)果,也會(huì)進(jìn)行相對(duì)簡(jiǎn)單的圖像處理和點(diǎn)云匹配計(jì)算任務(wù),同時(shí)依靠NVIDIA CUDA進(jìn)行加速,使得計(jì)算成本得以減少數(shù)百倍至每個(gè)模型幾角錢。 KIRI Engine 的核心價(jià)值不僅在于用更低的成本為 3D 開發(fā)者提供 3D 重建工具,更在于通過(guò)快速增長(zhǎng)的用戶在云端積累海量 3D 數(shù)據(jù)集。隨著 AI 帶來(lái)的創(chuàng)作變革,AI 生成 3D 模型將會(huì)是下一個(gè)生成式 AI 的主戰(zhàn)場(chǎng),而高度標(biāo)準(zhǔn)化的 3D 數(shù)據(jù)集是 AI 生成 3D 模型的必要條件。在生成式 AI 全面到來(lái)的時(shí)代,KIRI 正在面對(duì)一個(gè)更大的市場(chǎng)和全新的挑戰(zhàn)。
如何兼顧降低計(jì)算成本
與提升 3D 重建水平
傳統(tǒng)的照片 3D 建模技術(shù)對(duì) CPU 非常依賴,但 CPU 的硬件限制使得這種方法的成本過(guò)高,所以其應(yīng)用領(lǐng)域主要是資金充裕的大型企業(yè)和政府項(xiàng)目。人們與信息的交互方式正在因 VR/XR 的技術(shù)突破而經(jīng)歷從 2D 向 3D,和從信息互聯(lián)到空間互聯(lián)的范式轉(zhuǎn)移。這種范式轉(zhuǎn)移將極大帶動(dòng)市場(chǎng)對(duì) 3D 內(nèi)容的需求,顯然過(guò)去高成本的 3D 建模技術(shù)無(wú)法適應(yīng)市場(chǎng)的變化。因此,需要探索一種新的計(jì)算方式,在滿足不斷增加的 3D 重建需求的同時(shí),還要顛覆性地降低計(jì)算成本。
three.js 腳本在 Github 的周下載量 three.js 腳本作為制作 3D 內(nèi)容必不可少的工具之一,其下載量趨勢(shì)能側(cè)面反映出全球 3D 內(nèi)容的增長(zhǎng)趨勢(shì);而從表中可以看出 three.js 腳本在 Github 的周下載量在一年的時(shí)間內(nèi)翻了一倍,以此足以看出 3D 化的范式轉(zhuǎn)移在以驚人的速度滲透人們的交互方式。 在算法層面,KIRI 開創(chuàng)性地使用了神經(jīng)網(wǎng)絡(luò)和視覺算法混合計(jì)算的方法。這樣的優(yōu)勢(shì)在于神經(jīng)網(wǎng)絡(luò)重建能夠更好地還原一些無(wú)法被視覺算法重建的物體,例如高度反光或透明的物體,但對(duì)于特征點(diǎn)足夠多的物體,視覺算法能夠捕捉到更多的表面細(xì)節(jié)。 因?yàn)樯窠?jīng)網(wǎng)絡(luò)的加入,使用 GPU 是必然的選擇,因此使用 CPU+GPU 異構(gòu)計(jì)算,盡管擁有 CPU+GPU 的服務(wù)器價(jià)格大概會(huì)是同級(jí)別的 CPU 價(jià)格的 2 倍,但計(jì)算時(shí)間可以大概節(jié)約 11 倍。(用機(jī)器學(xué)習(xí)進(jìn)行 3D 模型的紋理貼圖計(jì)算,CPU 需耗時(shí) 1600 秒,但 GPU 只需 130 秒。) 同時(shí)對(duì) 3D 重建任務(wù)進(jìn)行 CUDA 加速并加入擴(kuò)/縮容機(jī)制 。在計(jì)算任務(wù)少的時(shí)候只使用單臺(tái) GPU 確保運(yùn)行穩(wěn)定,計(jì)算任務(wù)一旦開始變多,云架構(gòu)能夠自動(dòng)擴(kuò)容,最多使用數(shù)十臺(tái)服務(wù)器并行運(yùn)算。這樣一來(lái),通過(guò) CUDA 加速的神經(jīng)網(wǎng)絡(luò)算法能夠在大幅度降低單次運(yùn)行的時(shí)間成本,而擴(kuò)/縮容機(jī)制在確保用戶體驗(yàn)的同時(shí)避免資源浪費(fèi)。
NVIDIA 為 KIRI 提供高效穩(wěn)定算力支持
基于以上考量,KIRI 選擇 NVIDIA 的產(chǎn)品生態(tài)來(lái)提供支持。因?yàn)?NVIDIA 產(chǎn)品生態(tài)的多樣性能夠滿足全部技術(shù)需求,且提供高效穩(wěn)定的算力支持。 NVIDIA CUDA:通過(guò) CUDA 進(jìn)行計(jì)算加速是 KIRI Engine 得以高效且低成本運(yùn)行的重要原因之一。在傳統(tǒng)純 CPU 運(yùn)行環(huán)境里,哪怕是運(yùn)行最簡(jiǎn)單的 3D 重建算法也需要花費(fèi) 20-60 分鐘的時(shí)間。而通過(guò) CUDA 加速后,KIRI 目前的重建算法只需要 5 分鐘。(甚至 KIRI 正在努力嘗試達(dá)到 25 秒內(nèi)生成 3D 模型的加速。) NVIDIA GPU:KIRI 使用 NVIDIA GPU 來(lái)進(jìn)行神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練。神經(jīng)輻射場(chǎng)重建模型往往需要數(shù)個(gè)小時(shí)才能完成訓(xùn)練,但通過(guò) GPU 與 CUDA 的配合,再加上 KIRI 對(duì)算法的優(yōu)化,目前在 KIRI Engine 上完成神經(jīng)輻射場(chǎng)模型訓(xùn)練只需要 25 分鐘。( KIRI 也在努力對(duì)架構(gòu)和算法進(jìn)行優(yōu)化,力爭(zhēng)兩個(gè)月內(nèi)能夠?qū)⑸窠?jīng)網(wǎng)絡(luò)模型的訓(xùn)練縮減到 5 分鐘以內(nèi)。)
審核編輯 :李倩
-
NVIDIA
+關(guān)注
關(guān)注
14文章
4855瀏覽量
102711 -
AI
+關(guān)注
關(guān)注
87文章
29812瀏覽量
268109
原文標(biāo)題:借助 NVIDIA 技術(shù),用 AI 賦能 3D 內(nèi)容生成
文章出處:【微信號(hào):Leadtek,微信公眾號(hào):麗臺(tái)科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論