搜索歷史

清空

搜索熱詞

0

聊天消息
系統(tǒng)消息
評論與回復(fù)

查看更多

查看更多

查看更多

VIP于到期續(xù)費

登錄后你可以

下載海量資料
學(xué)習(xí)在線課程
觀看技術(shù)視頻
寫文章/發(fā)帖/加入社區(qū)

會員中心

創(chuàng)作中心

發(fā)布

創(chuàng)作活動

完善資料讓更多小伙伴認(rèn)識你，還能領(lǐng)取20積分哦，立即完善>

3天內(nèi)不再提示

谷歌發(fā)布VLOGGER AI模型，實現(xiàn)肖像朗讀音頻內(nèi)容

3 月 19 日，Google 在其官方博客上發(fā)布了關(guān)于 VLOGGER AI 模型的相關(guān)信息。這是一款利用用戶提供的肖像照片和音頻內(nèi)容，使人物生動地呈現(xiàn)音頻內(nèi)容并具備豐富面部表情的人工智能程序。

具體來說，VLOGGER AI 采用一種適應(yīng)虛擬肖像的多模態(tài) Diffusion 模型，通過 MENTOR 數(shù)據(jù)庫進(jìn)行訓(xùn)練，涵蓋了超80萬個人物肖像及超過2200小時的視頻數(shù)據(jù)。得益于此，VLOGGER 可以生成各種族、各年齡段、穿著多樣、姿態(tài)各異的肖像視頻。

研發(fā)團(tuán)隊指出，相較于之前的同類產(chǎn)品，VLOGGER 的獨特之處在于無需針對每個使用者進(jìn)行單獨培訓(xùn)，且不受限于人臉檢測和裁剪，能產(chǎn)出完整的圖像，且能夠處理更多元化的情境如可見的身軀或者其他身份特征，這對于真實再現(xiàn)人物交流過程至關(guān)重要。

谷歌將 VLOGGER 視為通往“通用聊天機(jī)器人”未來的關(guān)鍵一步，使人工智能能以自然的語音、手勢和眼神等方式與人類交互。除此之外，VLOGGER 還可用作報告、教育領(lǐng)域以及旁白等方面的輔助工具，并能對已有的電影進(jìn)行剪輯和表情調(diào)整。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

Google

Google

+關(guān)注

關(guān)注
5

文章
1748

瀏覽量
57182
模型

模型

+關(guān)注

關(guān)注
1

文章
3032

瀏覽量
48351
VLogger

VLogger

+關(guān)注

關(guān)注
0

文章
5

瀏覽量
8338

評論

相關(guān)推薦

谷歌推出多模態(tài)VLOGGER AI

谷歌最新推出的VLOGGER AI技術(shù)引起了廣泛關(guān)注，這項創(chuàng)新的多模態(tài)模型能夠讓靜態(tài)肖像圖“活”起來并“說話”。用戶只需提供一張人物

的頭像

發(fā)表于 03-22 10:45 ?676次閱讀

阿里巴巴推出全新AI圖生視頻模型EMO

近日，阿里巴巴集團(tuán)智能計算研究院宣布推出了一款革命性的AI圖片-音頻-視頻模型技術(shù)——EMO。據(jù)官方介紹，EMO是一種先進(jìn)的音頻驅(qū)動肖像視頻

的頭像

發(fā)表于 03-05 11:00 ?1138次閱讀

谷歌發(fā)布全新AI基礎(chǔ)世界模型Genie

谷歌近日宣布推出其最新研發(fā)的AI基礎(chǔ)世界模型——Genie。這款模型擁有驚人的110億參數(shù)，其獨特之處在于，僅需一張圖片，便能生成一個充滿活力和交互性的虛擬世界。用戶可以在這個世界中逐

的頭像

發(fā)表于 03-04 14:02 ?596次閱讀

谷歌發(fā)布全新AI模型Genie

谷歌近日發(fā)布了其全新的AI模型Genie，這一模型徹底改變了我們與數(shù)字世界的互動方式。Genie不僅可以接收文本提示、草圖或想法，還能將這些

的頭像

發(fā)表于 02-28 18:25 ?1519次閱讀

谷歌AI大模型Gemma全球開放使用

谷歌公司近日宣布，其全新的AI大模型Gemma現(xiàn)已在全球范圍內(nèi)開放使用。這一重要舉措不僅彰顯了谷歌在AI領(lǐng)域的領(lǐng)先地位，還為其在全球范圍內(nèi)的

的頭像

發(fā)表于 02-28 18:12 ?983次閱讀

谷歌發(fā)布AI基礎(chǔ)世界模型Genie

谷歌近日宣布了其生成式AI的全新里程碑——全新AI基礎(chǔ)世界模型Genie。這一創(chuàng)新技術(shù)允許用戶通過單張圖像提示，生成一個可玩的、交互式的虛擬環(huán)境，從而開啟了一個全新的數(shù)字體驗時代。

的頭像

發(fā)表于 02-28 17:41 ?655次閱讀

谷歌發(fā)布開源AI大模型Gemma

近日，谷歌發(fā)布了全新AI大模型Gemma，這款模型為各種規(guī)模的組織提供了前所未有的機(jī)會，以負(fù)責(zé)任的方式在商業(yè)應(yīng)用中進(jìn)行分發(fā)。

的頭像

發(fā)表于 02-28 17:38 ?716次閱讀

谷歌發(fā)布新型AI模型Genie

近日，谷歌推出了一款革命性的AI模型——Genie。這款模型能夠?qū)⒑唵蔚奈谋咎崾?、草圖或初步想法迅速轉(zhuǎn)化為一個可以互動和游戲的虛擬世界。這一突破性的技術(shù)無疑將改變?nèi)藗儎?chuàng)建和體驗虛擬世界

的頭像

發(fā)表于 02-28 10:05 ?598次閱讀

谷歌交互世界模型重磅發(fā)布

谷歌模型

北京中科同志科技股份有限公司

發(fā)布于 :2024年02月28日 09:13:06

谷歌DeepMind推新AI模型Genie，能生成2D游戲平臺

據(jù)報道，谷歌公司的DeepMind團(tuán)隊近期發(fā)布了AI模型Genie，此模型擁有多達(dá)110億個參數(shù)，能夠依據(jù)用戶提供的圖片及提示詞創(chuàng)建出相當(dāng)完

的頭像

發(fā)表于 02-27 14:53 ?632次閱讀

谷歌發(fā)布輕量級開源人工智能模型Gemma

谷歌近日宣布推出開源人工智能（AI）模型系列Gemma，旨在為開發(fā)人員和研究人員提供一個負(fù)責(zé)任的AI構(gòu)建平臺。這一舉措標(biāo)志著自2022年OpenAI的ChatGPT引領(lǐng)

的頭像

發(fā)表于 02-23 11:38 ?691次閱讀

谷歌大型模型終于開放源代碼，遲到但重要的開源戰(zhàn)略

在人工智能領(lǐng)域，谷歌可以算是開源的鼻祖。今天幾乎所有的大語言模型，都基于谷歌在 2017 年發(fā)布的 Transformer 論文；谷歌的

發(fā)表于 02-22 18:14 ?347次閱讀

<b class='flag-5'>谷歌</b>大型<b class='flag-5'>模型</b>終于開放源代碼，遲到但重要的開源戰(zhàn)略

谷歌推出AI擴(kuò)散模型Lumiere

近日，谷歌研究院重磅推出全新AI擴(kuò)散模型Lumiere，這款模型基于谷歌自主研發(fā)的“Space-Time U-Net”基礎(chǔ)架構(gòu)，旨在

的頭像

發(fā)表于 02-04 13:49 ?865次閱讀

獵戶星空發(fā)布強(qiáng)大AI大模型

近日，獵戶星空在2024·傅盛的開年AI大課暨獵戶星空企業(yè)應(yīng)用大模型發(fā)布會上，正式發(fā)布了其最新研發(fā)的大模型。這個大

的頭像

發(fā)表于 01-22 14:31 ?567次閱讀

谷歌發(fā)布全新AI SDK，簡化安卓應(yīng)用集成

谷歌破繭而出，全新發(fā)布 Google AI SDK，引領(lǐng) Android 應(yīng)用邁向高性能 AI 集成新時代。這次發(fā)布的 SDK，專門為 An

的頭像

發(fā)表于 01-03 14:18 ?664次閱讀

<li id="errwm"></li>

<form id="errwm"></form>