0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Facebook的黑科技Codec Avatars,展現(xiàn)了一個怎樣的社交帝國!

fFU3_vrtuoluo ? 來源:lp ? 2019-03-16 10:21 ? 次閱讀

近日,F(xiàn)acebook CEO 扎克伯格透露公司正在研究一款可用于AR眼鏡的腦機(jī)接口技術(shù),但該技術(shù)并非將AR眼鏡以植入性芯片的形式進(jìn)行,而是希望能開發(fā)成可量產(chǎn)的可穿戴技術(shù)。

類似《刀劍神域》中那般腦機(jī)接口被認(rèn)為是虛擬現(xiàn)實(shí)的最終形態(tài),也是最理想的形態(tài),然而這個離我們似乎還有些遙遠(yuǎn)。

一直想要發(fā)展VR社交的Facebook,一邊在規(guī)劃幾十年后的未來,同時也在踏踏實(shí)實(shí)地走好每一步。比如剛剛公布的Codec Avatars技術(shù),就讓VR社交中的虛擬人物表情動作達(dá)到了非常真實(shí)的狀態(tài),仿佛在虛擬世界中復(fù)刻了一個“真實(shí)”的你。

研究助理Autumn Trimble正坐在“Mugsy”里面,Mugsy正是Facebook位于匹茲堡的Facebook Reality Lab(FRL,原來Oculus 研發(fā)實(shí)驗(yàn)室Oculus Research),用于創(chuàng)建“codec avatars”的捕獲設(shè)施之一。

視頻畫面中有一名年輕女子,她的眼睛閃爍著光芒說:“門口站著一個大塊頭的傻瓜。然后他說:‘你以為你是誰,蓮娜·荷恩(上世紀(jì)美國超級黑人巨星)嗎?’我說雖然我不是荷恩,但我就像姐姐一樣了解荷恩?!?/p>

上面這段獨(dú)白來自沃頓·瓊斯的戲劇《1940年的廣播時刻》的開場白。畫面中的年輕女子繼續(xù)說著這段臺詞,能看出來她很清楚自己在做什么。當(dāng)她詳細(xì)講述門衛(wèi)的聲調(diào)變化時,臉上蕩漾出笑容,就像在跟你講笑話一般。她咬字準(zhǔn)確時,嘴唇的形狀會發(fā)生恰到好處的變化,聲音抑揚(yáng)頓挫。她的表情經(jīng)過如此精細(xì)的校準(zhǔn),朗讀臺詞時如此地胸有成竹,再加上黑色背景,恍然之中你會覺得自己仿佛正置身于百老匯劇院,眼前在上演的正是上世紀(jì)70年代后期的百老匯戲劇。

唯一的不足之處就是:她脖子以下的身體都消失不見了。

Yaser Sheikh伸出手停止了視頻的播放。剛剛畫面中的年輕女子實(shí)際上是一個看上去極其逼真的VR虛擬化身,她令人驚艷的表現(xiàn)背后是收集的數(shù)據(jù)在運(yùn)作。Sheikh是FRL的負(fù)責(zé)人,他還拿出了另一個令人印象更加深刻的視頻。在該視頻中,剛剛的那個女子和一個男子都戴著VR頭顯。在屏幕的左側(cè),真實(shí)世界中的他們正戴著頭顯在聊天; 而與此同時,在屏幕右側(cè),他們的虛擬化身正在聽著精彩絕倫的音樂會。他們聊天的話題卻很稀松平常,聊的是熱瑜伽——這樣的場景是對未來生活的驚鴻一瞥。

Facebook的新黑科技:Codec Avatars

多年以來,人們在虛擬現(xiàn)實(shí)中一直都是通過電腦生成的虛擬化身來代表我們進(jìn)行互動。VR頭戴設(shè)備和手持控制器都是可追蹤的,所以我們在現(xiàn)實(shí)世界中的頭部動作和手部動作可以出現(xiàn)在這些虛擬對話場景中,這些無意識的習(xí)慣動作也為虛擬世界中的對話平添了至關(guān)重要的一點(diǎn)——和諧感。

然而,即使我們的虛擬互動變得更加自然,由于技術(shù)限制,虛擬互動在視覺上只能保持在很簡單的程度——就像Rec Room和Altspace這樣的社交VR App一般,只能將我們的形象抽象成漫畫,基本不會(如果有的話)映射出我們在真實(shí)世界的表情。但Facebook的新技術(shù)Spaces能夠用社交媒體照片生成一個形象逼真的動畫形象,但有些表情仍然依賴于按鈕或手柄來觸發(fā)。即使像技術(shù)要求更高的平臺,如高保真領(lǐng)域,它的確可以讓用戶導(dǎo)入自己的3D掃描模型,但如果要求虛擬形象感覺像你一樣栩栩如生,道阻且長。

最初,Yaser Sheikh和他的團(tuán)隊(duì)在匹茲堡市區(qū)東部的自由社區(qū)租了一間小辦公室開始進(jìn)行這項(xiàng)技術(shù)的研發(fā)工作,目前他們已搬到卡內(nèi)基梅隆校園內(nèi),空間更大,并計(jì)劃在未來一兩年內(nèi)再次擴(kuò)展。FRL稱這項(xiàng)技術(shù)為CodecAvatars,是用機(jī)器收集、學(xué)習(xí)和重建人類社交表情的結(jié)果。目前,他們還沒有準(zhǔn)備好正式推出這項(xiàng)技術(shù)。最好的情況是,還需要花上幾年時間,前提是他們最后能夠成為Facebook部署計(jì)劃中的一部分。但是FRL團(tuán)隊(duì)已經(jīng)準(zhǔn)備好開始大展拳腳了。

Sheik說:“如果我們真的能把這件事做好,絕對是非常轟動的。我們想把它做出來,聊聊它的用武之地?!彼樕蠋е赜谐芍竦男θ?,對于團(tuán)隊(duì)能完成這項(xiàng)技術(shù)顯得信心十足。

1927年,美國人類學(xué)家、語言學(xué)家愛德華·薩丕爾發(fā)表了一篇文章《無意識的社會行為模式》。在文章中,薩丕爾提到人類對姿態(tài)的反應(yīng)是“一種復(fù)雜又神秘的代碼,沒有文字描述,無人得識,卻眾人皆知” 。92年之后,薩丕爾所說的精密“代碼”成為了Sheikh為之不斷努力的任務(wù)。

在Sheikh進(jìn)入Facebook之前,他是卡內(nèi)基梅隆大學(xué)的一名教授,負(fù)責(zé)研究計(jì)算機(jī)視覺與社交感知之間的交集。2015年,當(dāng)OculusVR首席科學(xué)家邁克爾·阿布拉什(Michael Abrash)與他聯(lián)系,討論AR和VR未來的方向時,Sheikh毫不猶豫地分享了自己的愿景?,F(xiàn)在,Sheikh手里總是端著一杯咖啡,他說:“VR的真正承諾是戴上頭顯進(jìn)行像視頻中這樣的對話,而不是飛來親自見到我。你能看到的形象,不是卡通版本也不是怪物版本,而是你在真實(shí)世界里的行為舉止和音容笑貌?!?/p>

在Sheikh為該設(shè)施撰寫的原始文件中,他將其描述為“社交實(shí)驗(yàn)室”,指的是大腦對虛擬環(huán)境和互動做出反應(yīng)的現(xiàn)象,如同對真實(shí)環(huán)境做出的反應(yīng)一般。然后,他還寫道他們認(rèn)為在7-8名員工的努力下,能夠在五年內(nèi)開發(fā)出照片級程度的虛擬化身。這項(xiàng)項(xiàng)目雖然保留下來了,但對此的期望卻發(fā)生了改變。這也同樣反映在其實(shí)驗(yàn)室的名稱上:Oculus Research去年改名為FacebookReality Labs。

Codec Avatars的原理很簡單,是一種雙重測試,Sheikh稱之為“自我測試”和“母測試”:你應(yīng)該愛你的形象,被你所愛的形象也應(yīng)該愛你。啟用虛擬化身的過程要復(fù)雜得多。第一次使用是在一個名為Mugsy的圓頂狀房間里,房間中的墻和天花板上鑲嵌著132個現(xiàn)成的佳能鏡頭和350個燈光,均聚焦在椅子上。坐在房間中心的感覺就像是置身于一個由狗仔隊(duì)組成的黑洞里。 Sheikh還說:“我之前給這個地方取名叫“Mugshooter(臉部狙擊)”,但是之后我們覺得到這是一個挺可怕的名字,不太好?!?不過Mugsy早已經(jīng)歷了幾次更新,Mugsy的攝像頭變多了,能力也變得更強(qiáng),把那些老早的設(shè)備(比如在一根繩子上綁上乒乓球,讓參與者的臉保持在合適的位置上,就像車庫里的車一樣擺正)淘汰了。

在Mugsy中,研究參與者花了大約一個小時坐在椅子上,制作了一系列超大的面部表情和大音量的朗讀聲線,而另一個房間的員工通過網(wǎng)絡(luò)攝像頭指導(dǎo)他們?nèi)绾巫龀鲞m當(dāng)?shù)谋砬?。“像魚那樣活動臉頰,”技術(shù)項(xiàng)目經(jīng)理Danielle Belko說道。

另一個名為Sociopticon的捕獲設(shè)施會更好地應(yīng)用于第二個捕獲區(qū)域(在加入Oculus/Facebook之前,Sheikh在Carnegie Mellon建立了它的前身Panoptic Studio)。Sociopticon看起來很像微軟的MR捕捉工作室,雖然有著更多的相機(jī)(180到106)、更高的分辨率(2.5K)和更高的幀速率(90Hz)。當(dāng)Mugsy集中捕獲面部表情時,Sociopticon幫助Codec Avatar系統(tǒng)了解我們的穿著,以及我們的身體如何進(jìn)行移動。因此,人們在那里的時間并不僅僅是活動面部表情,還要搖晃四肢,四處跳躍,通過網(wǎng)絡(luò)攝像頭與Belko玩耍。

這一切的關(guān)鍵是盡可能多地捕獲信息,Mugsy和Sociopticon每秒可以收集180千兆字節(jié)的信息,以便神經(jīng)網(wǎng)絡(luò)盡可能學(xué)習(xí)從每個可能的角度將表情和運(yùn)動映射到聲音和肌肉。它捕獲的信息越多,其“深度外觀模型”就越強(qiáng)大,從而更好地將信息編碼為數(shù)據(jù),然后在另一端,另一個人的頭顯將其解碼為虛擬化身,這就是Codec Avatars中的編解碼的過程。

這不僅僅是原始的測量。正如研究科學(xué)家Jason Saragih告訴我那樣,他們還必須將數(shù)據(jù)解釋出來。畢竟普通用戶的起居室里并沒有Mugsy和Sociopticon,他們只有AR/VR頭顯。雖然今天的VR可穿戴設(shè)備被稱為頭戴式顯示器,但FRL的研究人員已經(jīng)創(chuàng)建了一系列HMC或頭戴式捕捉設(shè)備。這些HMC在面部各個區(qū)域設(shè)置了紅外LED和相機(jī),允許軟件將數(shù)據(jù)重新融入到人的形象中。

在不久的將來,Sheikh和他的團(tuán)隊(duì)希望能夠?qū)⒚娌繏呙钄U(kuò)展到整個身體,因此軟件需要能夠解決Saragih所謂的“外在性”,否則虛擬交互將不會那么逼真。例如當(dāng)人們處于黑暗狀態(tài)時,系統(tǒng)需要進(jìn)行補(bǔ)償。如果你將手放在背后,系統(tǒng)需要解決這個問題,這樣如果你的朋友在VR中走到你背后,他們就可以看到你的手在做什么。還有一些其他的東西,比如預(yù)測用戶的移動方式,從而保證虛擬化身的運(yùn)動能盡可能順利,但它們都旨在消除變量,讓你的虛擬形象成為一個不受約束、純粹的代表。

體驗(yàn):效果驚艷,略有瑕疵

把人的形象栩栩如生的展現(xiàn)出來很難,這才是事實(shí)。即使是超級大片一般的電子游戲也會在頭發(fā)、眼睛、鼻子和嘴巴內(nèi)部等細(xì)節(jié)上掙扎,總會有一些部分讓它們看起來并不像是完全的人類。根據(jù)我對捕獲過程的經(jīng)驗(yàn),當(dāng)我戴上頭顯與Sheikh和研究員Steve Lombardi進(jìn)行實(shí)時聊天時,我預(yù)想在VR中會出現(xiàn)同樣的情況。

但事實(shí)上并沒有。Sheikh的化身雖然沒有他現(xiàn)實(shí)生活中那樣的胡須或圓形眼鏡,但這就是他,并且是完全的他。當(dāng)他邀請我靠近并仔細(xì)觀察他臉上的胡茬時,感覺非常具有侵略性。Steve Lombardi也是這樣,當(dāng)后來他的真人走進(jìn)房間時,我覺得我早就認(rèn)識他了,盡管我只在VR中見過他。雖然結(jié)果并不完美,例如當(dāng)人們興奮地說話時,他們虛擬化身嘴巴的動作并沒有和語調(diào)相統(tǒng)一,此外頭發(fā)雖然根根分明,但周圍總有一個模糊的光環(huán),舌頭看起來也有些模糊,但總體看來,效果是令人感到不可置信的好。

這次的體驗(yàn)是一個很了不起的經(jīng)歷,同時也很麻煩。雖然Codec Avatars還是一個研究項(xiàng)目,但我們現(xiàn)在已經(jīng)對它有了一定了解。

之前大火的AI換臉程序Deepfakes可以憑空創(chuàng)造面孔,人們的數(shù)據(jù)隱私、錯誤信息活動和惡性行為已經(jīng)成為當(dāng)下互聯(lián)網(wǎng)上非常真實(shí)的問題。隨著VR和AR出現(xiàn)并成為人類主流的通信平臺,這些問題將會變得更加嚴(yán)重。你覺得網(wǎng)絡(luò)上的騷擾很糟糕嗎?你認(rèn)為能增加體現(xiàn)個人空間的VR會令人不安嗎?人們對此還沒有足夠的了解。

Sheikh理解這種擔(dān)憂?!罢鎸?shí)性不僅對Codec Avatars的成功至關(guān)重要,對于保護(hù)用戶也很重要,”他說道?!叭绻憬拥侥隳赣H打來的電話,你聽到了她的聲音,那么你不會產(chǎn)生任何疑問,因?yàn)樗f的就是你所聽到的對嗎?我們必須建立這樣的信任,并從一開始就保持。”他引用HMC上的傳感器作為認(rèn)證的重要手段:我們的眼睛、聲音甚至習(xí)慣都是一種生物識別技術(shù)。在過去幾年中,圍繞數(shù)據(jù)隱私和虛擬現(xiàn)實(shí)的對話越來越多,而這樣的突破可能會使他們的熱度達(dá)到一個新高度。

對于VR在過去十年間所取得的所有進(jìn)步,像Codec Avatars這樣的技術(shù)代表了我們正在向全新體驗(yàn)階段過渡。每年在Oculus Connect開發(fā)者大會上,邁克爾·阿布拉什都會上臺演講,并公布公司的最新研究和創(chuàng)新項(xiàng)目的狀態(tài)。隨著時間的推移,他更看好VR的一些突破。他說道:“我不是在打賭說四年內(nèi)就一定能開發(fā)出令人折服的虛擬形象,但這也不是完全不可能的事?!?/p>

現(xiàn)在和Yaser Sheikh坐在一起,我問他對當(dāng)時阿布拉什的宣言有何感受?

“他是對的,”他微笑著喝著咖啡說道。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Facebook
    +關(guān)注

    關(guān)注

    3

    文章

    1429

    瀏覽量

    54610
  • 黑科技
    +關(guān)注

    關(guān)注

    14

    文章

    127

    瀏覽量

    37245
  • AR眼鏡
    +關(guān)注

    關(guān)注

    4

    文章

    520

    瀏覽量

    22980

原文標(biāo)題:Facebook最新黑科技:在虛擬世界中復(fù)刻一個“真實(shí)”的你

文章出處:【微信號:vrtuoluo,微信公眾號:VR陀螺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    請問AUDIO CODEC可以獲得模擬輸入信號的頻率嗎?

    我在設(shè)計(jì)電路,需要得到輸入的模擬信號的頻率,有300Hz的,1500Hz的還有2300Hz的,這幾個信號可以通過AUDIO CODEC 的ADC,然后求得輸入信號的頻率是多少嗎? 應(yīng)該
    發(fā)表于 11-07 08:18

    音頻codec的Sidetone Insertion有什么用?

    音頻codec中的Sidetone Insertion有什么作用,看了不是很明白,哪位大俠幫忙具體解釋下吧
    發(fā)表于 11-07 07:29

    配置TPS65930_codec時predriver始終處于高電平,為什么?

    求問大神,我在配置TPS65930_codec時,我在CPU端輸出單音給65930的codec,但是在predriver端只能測量到
    發(fā)表于 10-29 07:41

    TPS65930配置codec on不能配置成功是怎么回事?

    我在配置65930的audio模塊,時想要配置codec on卻不能配置成功,不清楚是為什么?芯片自身的時鐘電源都沒有問題,想問下是不是在選擇通路時必須符合什么規(guī)則才能使配置codec on成功,audio模塊才能運(yùn)行起來
    發(fā)表于 10-29 06:42

    準(zhǔn)備用TLV320AIC3254來做codec,加mcu來控制,要怎么操作?

    蘋果使用lighting數(shù)字音頻接口,哪位大神有方案啊,我準(zhǔn)備用TLV320AIC3254來做codec,加mcu來控制 蘋果的數(shù)字音頻芯片LAM的框圖和引腳定義如下:
    發(fā)表于 10-28 07:43

    C6748做主提供codec時鐘,請問MCASP邊沿觸發(fā)應(yīng)該怎么設(shè)置?

    我們公司音頻的項(xiàng)目,基本架構(gòu)是c6748加AIC3106。后來換了codec,這個新的code
    發(fā)表于 10-21 07:03

    TLV320AIC3204 DSP將數(shù)據(jù)再通過codec的DA播放語音,用示波器看codec的輸出,波形失真的原因?

    ,通過DOUT管腳輸出到DSP。用兩種方法測試。第種,用示波器直接抓取DOUT數(shù)據(jù),連續(xù)抓取8,發(fā)現(xiàn)數(shù)據(jù)約為32767 ,32767 ,32767 ,14032 ,32767 ,32767
    發(fā)表于 10-16 06:10

    使用tlv320aic3254進(jìn)行MIC數(shù)據(jù)采集,想使用codec內(nèi)部的濾波算法,是不是可以用TI biquad生成參數(shù)就可以?

    使用tlv320aic3254進(jìn)行MIC數(shù)據(jù)采集,想使用codec內(nèi)部的濾波算法,是不是可以用TI biquad生成參數(shù)就可以?目前設(shè)計(jì)簡易的濾波系數(shù),是否合理?
    發(fā)表于 09-30 07:57

    迅為RK3588開發(fā)板!神話悟空,啟動?

    iTOP-RK3588上進(jìn)行展示的,但這也代表獨(dú)屬于我們嵌入式工程師的浪漫,最后祝每一個天命人尋齊六根,成為真正的齊天大圣。
    發(fā)表于 09-23 10:48

    防水帝國的綠色創(chuàng)新之路,太city!

    市值千億的防水帝國。 在低碳發(fā)展的道路上,東方雨虹不僅在防水技術(shù)上持續(xù)創(chuàng)新,更在光伏領(lǐng)域展現(xiàn)出其前瞻性的戰(zhàn)略布局。公司全面布局分布式光伏屋面防水市場,致力于將綠色能源與建筑防水技術(shù)深度融合,推動能源結(jié)構(gòu)的綠色轉(zhuǎn)型
    的頭像 發(fā)表于 07-25 16:18 ?169次閱讀

    云手機(jī)海外社交媒體監(jiān)測:洞悉輿論,把握商機(jī)

    在當(dāng)前社交媒體時代,facebook、Twitter、tiktok等平臺已經(jīng)成為信息傳播的主渠道,個體傳播權(quán)和知情權(quán)回歸,輿論力量愈發(fā)強(qiáng)大。在這個背景下,如何有效進(jìn)行海外社交媒體監(jiān)測,防范危機(jī)、精準(zhǔn)
    的頭像 發(fā)表于 03-04 16:35 ?393次閱讀

    SpaceX首次通過星鏈從太空向社交平臺X上發(fā)帖

    近日,埃隆·馬斯克旗下的太空探索技術(shù)公司SpaceX宣布,他們已成功通過其著名的“星鏈”衛(wèi)星網(wǎng)絡(luò),從太空向社交平臺X發(fā)布一個帖子。這創(chuàng)新性的舉動標(biāo)志著太空技術(shù)與
    的頭像 發(fā)表于 02-27 18:19 ?1488次閱讀

    新火種AI|AI社交,大廠競逐的新戰(zhàn)場

    作者:號 編輯:美美 AI時代的社交王者,這塊“蛋糕”誰都想吃下。 如果說QQ是中國互聯(lián)網(wǎng)時代的代表性社交產(chǎn)品,那么在移動互聯(lián)網(wǎng)時代,微信就是當(dāng)之無愧的移動互聯(lián)網(wǎng)社交王者。這
    的頭像 發(fā)表于 02-18 14:35 ?353次閱讀
    新火種AI|AI<b class='flag-5'>社交</b>,大廠競逐的新戰(zhàn)場

    當(dāng)電源的正接到另一個電源的負(fù)會怎樣?為什么?

    當(dāng)電源的正接到另一個電源的負(fù)會怎樣?為什么? 當(dāng)電源的正極連接到另
    的頭像 發(fā)表于 01-16 11:06 ?3155次閱讀

    華為汽車生態(tài)帝國

    來源:電子工程專輯,謝謝 編輯:感知芯視界 Link 近日,華為與賽力斯發(fā)布問界M9,“千萬元內(nèi)最好的SUV”再次“遙遙領(lǐng)先”。從發(fā)布會介紹來看,問界M9確實(shí)擁有很多“科技”,在智能汽車中成為
    的頭像 發(fā)表于 01-16 10:42 ?623次閱讀