0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌推出ARCore,手機(jī)上體驗(yàn)宇宙大爆炸,實(shí)現(xiàn)AR效果

jmiy_worldofai ? 來源:楊湘祁 ? 作者:電子發(fā)燒友 ? 2019-03-11 08:38 ? 次閱讀

谷歌藝術(shù)與文化推出新作品,手機(jī)上體驗(yàn)宇宙大爆炸,并可以作為背景進(jìn)行自拍。而谷歌博客解釋了如何使用ARCore和機(jī)器學(xué)習(xí),只用一個(gè)手機(jī)攝像頭就可以實(shí)現(xiàn)給自拍加AR特效的工作原理。

谷歌與歐洲研究機(jī)構(gòu)CERN合作創(chuàng)建了一個(gè)增強(qiáng)現(xiàn)實(shí)應(yīng)用程序,可以讓用戶通過手機(jī)體驗(yàn)宇宙大爆炸Big Bang,感受上帝創(chuàng)世紀(jì)時(shí)候的宏偉壯闊。

應(yīng)用程序?qū)Ыo你一場(chǎng)360度的奇幻旅程,從宇宙誕生開始,到第一顆恒星誕生,直到我們的太陽系,以及地球的出現(xiàn)。

更有意思的是,你還可以以大爆炸作為背景,進(jìn)行自拍!可以說是超炫酷了。各大應(yīng)用商店搜索Google Arts & Culture下載。

如果你使用的是Android手機(jī),你需要確認(rèn)一下是否裝了ARCore。

ARCore是谷歌推出的搭建增強(qiáng)現(xiàn)實(shí)(Augmented Reality,簡(jiǎn)稱 AR)應(yīng)用程序的軟件平臺(tái),類似蘋果的ARKit,它可以利用云軟件和設(shè)備硬件的進(jìn)步,將數(shù)字對(duì)象放到現(xiàn)實(shí)世界中。

用ARCore實(shí)現(xiàn)AR效果

增強(qiáng)現(xiàn)實(shí),是一種實(shí)時(shí)地計(jì)算攝影機(jī)影像的位置及角度并加上相應(yīng)圖像的技術(shù),這種技術(shù)的目標(biāo)是在屏幕上把虛擬世界套在現(xiàn)實(shí)世界并進(jìn)行互動(dòng)。

這種技術(shù)最早于1990年提出。隨著隨身電子產(chǎn)品運(yùn)算能力的提升,增強(qiáng)現(xiàn)實(shí)的用途越來越廣。比如下面這個(gè)動(dòng)圖,通過AR設(shè)備你可以看到實(shí)際并不存在的藍(lán)色光圈。

AR已經(jīng)被廣泛應(yīng)用于自拍、短視頻、直播app中,可以實(shí)現(xiàn)一些好玩的效果。而其中最關(guān)鍵的挑戰(zhàn)在于將虛擬內(nèi)容適當(dāng)?shù)劐^定到現(xiàn)實(shí)世界中。這個(gè)過程需要一套獨(dú)特的感知技術(shù),能夠跟蹤每個(gè)微笑,皺眉或傻笑背后的高動(dòng)態(tài)表面幾何。

所以今天我們就為大家介紹一下,開發(fā)者如何借助最新版本ARCore的全新Augmented Faces API,使機(jī)器學(xué)習(xí)(ML)來推斷近似的3D表面幾何形狀,從而只需要一個(gè)攝像機(jī)輸入,無需專用的深度傳感器就可以實(shí)現(xiàn)給自拍添加動(dòng)畫特效,比如添加眼鏡、3D帽子等物品。

3D網(wǎng)格及其實(shí)現(xiàn)的一些效果

這種方法提供了實(shí)時(shí)速度的AR效果,使用TensorFlow Lite進(jìn)行移動(dòng)CPU推理或其可用的新移動(dòng)GPU功能。

此技術(shù)與YouTube Stories的新creator effect效果相同,并且通過最新的ARCore SDK版本和ML Kit Face Contour Detection API,可供更廣泛的開發(fā)人員社區(qū)使用。

自拍AR的ML pipeline

我們的ML pipeline由兩個(gè)一起工作的實(shí)時(shí)深度神經(jīng)網(wǎng)絡(luò)模型組成。一個(gè)探測(cè)器,在整個(gè)圖像上運(yùn)行,并計(jì)算面部位置;一個(gè)通用3D網(wǎng)格模型,在這些位置上運(yùn)行并通過回歸預(yù)測(cè)近似表面幾何。

精確地裁剪面部可以大大減少對(duì)共同數(shù)據(jù)增強(qiáng)的需求,例如由旋轉(zhuǎn),平移和比例變化組成的仿射變換。

它允許網(wǎng)絡(luò)將其大部分容量用于坐標(biāo)預(yù)測(cè)準(zhǔn)確度,這對(duì)于實(shí)現(xiàn)虛擬內(nèi)容的正確錨定至關(guān)重要。

一旦需要的位置被裁剪,網(wǎng)格網(wǎng)絡(luò)每次僅應(yīng)用于單個(gè)幀,使用窗口平滑以便在面部靜止時(shí)減少噪聲,同時(shí)避免在快速移動(dòng)時(shí)滯后。

3D網(wǎng)格

對(duì)于我們的3D網(wǎng)格,我們采用了傳遞學(xué)習(xí)并訓(xùn)練了一個(gè)具有多個(gè)目標(biāo)的網(wǎng)絡(luò)。

網(wǎng)絡(luò)同時(shí)預(yù)測(cè)合成、渲染數(shù)據(jù)上的3D網(wǎng)格坐標(biāo),以及類似于MLKit提供的帶注釋的真實(shí)世界數(shù)據(jù)的2D語義輪廓。

由此產(chǎn)生的網(wǎng)絡(luò)不僅在合成上,而且在現(xiàn)實(shí)世界數(shù)據(jù)上為我們提供了合理的3D網(wǎng)格預(yù)測(cè)。

所有模型都接受來自地理上不同數(shù)據(jù)集的數(shù)據(jù)培訓(xùn),隨后在平衡,多樣化的測(cè)試集上進(jìn)行測(cè)試,以獲得定性和定量性能。

3D網(wǎng)格網(wǎng)絡(luò)接收裁剪的視頻幀作為輸入。它不依賴于額外的深度輸入,因此它也可以應(yīng)用于預(yù)先錄制的視頻。

該模型輸出3D點(diǎn)的位置,以及在輸入中存在并合理對(duì)齊的面部概率。一種常見的替代方法是預(yù)測(cè)每個(gè)地標(biāo)的2D熱圖,但它不適合深度預(yù)測(cè),并且對(duì)于這么多點(diǎn)具有高計(jì)算成本。

通過迭代引導(dǎo)和細(xì)化預(yù)測(cè)來進(jìn)一步提高模型的準(zhǔn)確性和魯棒性。這樣我們就可以將我們的數(shù)據(jù)集增長(zhǎng)到越來越具有挑戰(zhàn)性的案例,例如鬼臉,斜角和遮擋。

數(shù)據(jù)集增強(qiáng)技術(shù)還擴(kuò)展了可用的地面實(shí)況數(shù)據(jù),開發(fā)了模型對(duì)相機(jī)缺陷或極端光照條件等工件的彈性。

數(shù)據(jù)集擴(kuò)展和改進(jìn)pipeline

我們使用TensorFlow Lite進(jìn)行設(shè)備上的神經(jīng)網(wǎng)絡(luò)推理。新推出的GPU后端加速可在可用的情況下提升性能,并顯著降低功耗。

此外,為了涵蓋廣泛的消費(fèi)類硬件,我們?cè)O(shè)計(jì)了各種具有不同性能和效率特性的模型架構(gòu)。

較輕的網(wǎng)絡(luò)最重要的區(qū)別是殘余塊布局和可接受的輸入分辨率(最輕的模型中為128x128像素,而最復(fù)雜的模型中為256x256)。

我們還改變了層數(shù)和子采樣率(輸入分辨率隨網(wǎng)絡(luò)深度減小的速度)。

每幀的推理時(shí)間:CPU與GPU

這些優(yōu)化的結(jié)果是使用較輕型號(hào)的顯著加速,AR效果質(zhì)量的降低最小。

比較最復(fù)雜(左)和最輕的模型(右)。

在輕型模型上,時(shí)間一致性以及唇部和眼睛跟蹤略微降低

這些努力的最終結(jié)果是通過以下方式為用戶體驗(yàn)在YouTube,ARCore和其他客戶中提供令人信服的,逼真的自拍AR效果:

通過環(huán)境映射模擬光反射,實(shí)現(xiàn)眼鏡的逼真渲染

通過將虛擬對(duì)象陰影投射到面網(wǎng)格上來實(shí)現(xiàn)自然光照

對(duì)面部遮擋建模以隱藏面部后面的虛擬對(duì)象部分,例如虛擬眼鏡,如下圖所示

YouTube Stories基于3D網(wǎng)格的逼真虛擬眼鏡

此外,我們通過以下方式實(shí)現(xiàn)高度逼真的妝效:

建模在嘴唇和嘴唇上應(yīng)用的鏡面反射

通過使用亮度感知材料進(jìn)行面部繪畫

案例研究將不同光照條件下5個(gè)主題的真實(shí)化妝與AR妝容進(jìn)行比較。

未來,谷歌計(jì)劃將此技術(shù)擴(kuò)展到更多谷歌產(chǎn)品中。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 手機(jī)
    +關(guān)注

    關(guān)注

    34

    文章

    6792

    瀏覽量

    156678
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6080

    瀏覽量

    104353
  • Ar
    Ar
    +關(guān)注

    關(guān)注

    24

    文章

    5047

    瀏覽量

    168601

原文標(biāo)題:138億年在手中!谷歌用手機(jī)體驗(yàn)宇宙大爆炸,還教你用機(jī)器學(xué)習(xí)實(shí)現(xiàn)AR自拍特效

文章出處:【微信號(hào):worldofai,微信公眾號(hào):worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    谷歌加入增強(qiáng)現(xiàn)實(shí)可穿戴設(shè)備AR聯(lián)盟

    來源:Yole Group AR 聯(lián)盟(AR Alliance)宣布谷歌將成為下一位創(chuàng)始成員,并在董事會(huì)占有一席之地。 AR 聯(lián)盟為各種規(guī)模的組織機(jī)構(gòu)提供了一個(gè)支持性和中立的環(huán)境,使其
    的頭像 發(fā)表于 06-26 16:34 ?249次閱讀

    榮耀新品將搭載谷歌AI功能,提升生成式AI體驗(yàn)

    榮耀于5月22日宣布,將在新款智能手機(jī)上集成谷歌的AI功能,實(shí)現(xiàn)生成式AI體驗(yàn)。此外,新機(jī)還將得到谷歌云服務(wù)的支持。
    的頭像 發(fā)表于 05-23 08:51 ?342次閱讀

    什么是元宇宙,AR/VR和它又是什么關(guān)系呢?

    最近蘋果公司的Vision pro上市預(yù)售掀起了一波潮流,元宇宙的概念又火了。那么什么是元宇宙AR/VR和它又是什么關(guān)系呢?
    的頭像 發(fā)表于 04-22 15:14 ?1364次閱讀

    谷歌計(jì)劃將先進(jìn)大模型Gemini明年嵌入安卓手機(jī)

    谷歌對(duì)其人工智能大模型在智能手機(jī)上的應(yīng)用前景持樂觀態(tài)度,并預(yù)計(jì)其更先進(jìn)的大模型Gemini將于明年嵌入安卓手機(jī)。這一消息由谷歌Pixel部門產(chǎn)品管理副總裁布萊恩·拉科夫斯基(Brian
    的頭像 發(fā)表于 03-06 11:37 ?588次閱讀

    Meta拒絕和谷歌在VR/AR領(lǐng)域合作提議

    Meta拒絕和谷歌在VR/AR領(lǐng)域合作提議 據(jù)外媒報(bào)道,Meta拒絕和谷歌在VR/AR領(lǐng)域合作的提議。 谷歌原本希望通過合作促成混合現(xiàn)實(shí)頭顯
    的頭像 發(fā)表于 03-02 15:48 ?2897次閱讀

    谷歌模型怎么用手機(jī)打開

    要使用手機(jī)打開谷歌模型,首先需要明確一點(diǎn):谷歌模型本身是在計(jì)算機(jī)上運(yùn)行的程序或算法,而不是可以直接在手機(jī)上打開的應(yīng)用程序。然而,你可以通過
    的頭像 發(fā)表于 03-01 16:23 ?460次閱讀

    谷歌模型怎么用手機(jī)打開網(wǎng)頁

    請(qǐng)注意,谷歌模型本身是一個(gè)計(jì)算機(jī)程序,它并不能直接在手機(jī)瀏覽器上運(yùn)行。但是,你可以使用手機(jī)上谷歌瀏覽器來訪問和瀏覽網(wǎng)頁,這些網(wǎng)頁可能是由谷歌
    的頭像 發(fā)表于 03-01 16:19 ?476次閱讀

    谷歌模型軟件怎么用手機(jī)下載

    要在手機(jī)上下載谷歌模型軟件,您可以遵循以下步驟。
    的頭像 發(fā)表于 02-29 18:16 ?848次閱讀

    谷歌模型怎么用手機(jī)打開文件格式

    谷歌在其AI技術(shù)中集成了多種工具和功能,用于處理和識(shí)別文件格式。具體到手機(jī)上打開的文件格式,這主要依賴于谷歌提供的服務(wù)和應(yīng)用。例如,在Gmail中,用戶可以直接查看多種格式的文件,包括PDF
    的頭像 發(fā)表于 02-29 17:38 ?709次閱讀

    谷歌推出AI擴(kuò)散模型Lumiere

    近日,谷歌研究院重磅推出全新AI擴(kuò)散模型Lumiere,這款模型基于谷歌自主研發(fā)的“Space-Time U-Net”基礎(chǔ)架構(gòu),旨在實(shí)現(xiàn)視頻生成的一次性完成,同時(shí)保證視頻的真實(shí)性和動(dòng)作
    的頭像 發(fā)表于 02-04 13:49 ?865次閱讀

    應(yīng)用材料宣布與谷歌合作,開發(fā)AR技術(shù)

    此外,應(yīng)用材料公司的保羅·邁斯納博士指出,本司將運(yùn)用先進(jìn)光學(xué)技術(shù)及卓越輕量化設(shè)計(jì)理念,助力新一代AR產(chǎn)品的誕生。他還強(qiáng)調(diào),應(yīng)用材料與谷歌的聯(lián)合,將為AR產(chǎn)品打開無限可能。
    的頭像 發(fā)表于 01-11 09:51 ?399次閱讀

    宇宙猜想】AR文創(chuàng)入駐今日美術(shù)館、北京天文館等眾多展館,在AR互動(dòng)中感受科技魅力!

    近日,由 「宇宙猜想」 推出AR系列文創(chuàng)產(chǎn)品先后入駐今日美術(shù)館、北京天文館、國(guó)家自然博物館、上海天文館、國(guó)家海洋館、中華手工展館等各大館場(chǎng)并與其展開相關(guān)合作。 「宇宙猜想」致力于創(chuàng)
    的頭像 發(fā)表于 12-27 10:04 ?480次閱讀

    宇宙實(shí)現(xiàn)需要哪些MEMS技術(shù)

    宇宙實(shí)現(xiàn)需要哪些MEMS技術(shù)
    的頭像 發(fā)表于 11-24 17:12 ?315次閱讀

    宇宙AR、VR 和會(huì)議的未來

    宇宙(Metaverse)這個(gè)概念早在上世紀(jì)90年代就被提出,但直到2020年,隨著疫情的影響以及Epic Games、Decentraland、Roblox、Epic Games、Sandbox
    的頭像 發(fā)表于 11-15 14:29 ?503次閱讀

    宇宙猜想 ” AR明信片 亮相蘇州高新區(qū)城市形象展 吸睛無數(shù)!

    , 「宇宙猜想」所呈現(xiàn)的“元宇宙文創(chuàng)”項(xiàng)目, 以其獨(dú)特的創(chuàng)意和科技應(yīng)用,展示了豐富的中國(guó)文化內(nèi)涵和元宇宙科技文創(chuàng)產(chǎn)品成果,吸引了眾多參展者的目光。 展會(huì)現(xiàn)場(chǎng),參展者可免費(fèi)領(lǐng)取「宇宙猜想
    的頭像 發(fā)表于 11-13 16:27 ?340次閱讀
    “ <b class='flag-5'>宇宙</b>猜想 ” <b class='flag-5'>AR</b>明信片 亮相蘇州高新區(qū)城市形象展 吸睛無數(shù)!