在线观看国产91小视频,免费播放婬乱男女婬视频国产,无码h片在线观看网站

您是否曾經(jīng)僅僅根據(jù)他們的聲音來構(gòu)造一個(gè)從未見過的人的心理形象？人工智能（AI）現(xiàn)在可以做到這一點(diǎn)，僅使用簡短的音頻剪輯作為參考即可生成人臉的數(shù)字圖像。

這個(gè)名為“ Speech2Face” 的神經(jīng)網(wǎng)絡(luò)（一種以類似于人腦的方式“思考”的計(jì)算機(jī)）經(jīng)過科學(xué)家培訓(xùn)，接受了來自互聯(lián)網(wǎng)的數(shù)百萬個(gè)教育視頻，顯示了100，000多個(gè)不同的人在說話。

研究人員在一項(xiàng)新研究中寫道，Speech2Face通過該數(shù)據(jù)集學(xué)習(xí)了語音提示與人臉某些物理特征之間的關(guān)聯(lián)。然后，AI使用音頻剪輯對與語音匹配的真實(shí)感面部建模。

值得慶幸的是，人工智能還不能僅僅根據(jù)他們的聲音確切地知道特定的人是什么樣。研究作者報(bào)告說，神經(jīng)網(wǎng)絡(luò)識(shí)別語音中的某些標(biāo)記，這些標(biāo)記指向性別，年齡和種族，是許多人共有的特征。

科學(xué)家寫道：“因此，該模型只會(huì)產(chǎn)生看上去普通的面孔。” “它不會(huì)產(chǎn)生特定個(gè)人的圖像。”

盡管坦率地說，對貓的解釋有點(diǎn)讓人恐懼，但AI已經(jīng)證明它可以產(chǎn)生出異常準(zhǔn)確的人臉。

由Speech2Face生成的臉部-均面向正面并具有中性表情-與聲音背后的人并不完全匹配。但是，根據(jù)這項(xiàng)研究，這些圖像通常確實(shí)可以捕捉到正確的年齡范圍，種族和性別。

但是，該算法的解釋遠(yuǎn)非完美。當(dāng)面對語言變化時(shí)，Speech2Face表現(xiàn)出“混合表現(xiàn)”。例如，當(dāng)AI收聽亞洲人講中文的音頻片段時(shí)，該程序會(huì)產(chǎn)生亞洲人臉的圖像。然而，據(jù)科學(xué)家報(bào)道，當(dāng)同一個(gè)人用不同的音頻片段講英語時(shí)，人工智能產(chǎn)生了白人的面孔。

該算法還顯示出性別偏見，將低音調(diào)的聲音與男性面孔相關(guān)聯(lián)，將高音調(diào)的聲音與女性面孔相關(guān)聯(lián)。研究人員寫道，由于訓(xùn)練數(shù)據(jù)集僅代表YouTube上的教育視頻，因此“并不代表整個(gè)世界人口?！?/p>

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

數(shù)字圖像

數(shù)字圖像

+關(guān)注

關(guān)注
2

文章
119

瀏覽量
18723
人工智能

人工智能

+關(guān)注

關(guān)注
1789

文章
46652

瀏覽量
237090
數(shù)據(jù)集

數(shù)據(jù)集

+關(guān)注

關(guān)注
4

文章
1200

瀏覽量
24619

評(píng)論

相關(guān)推薦

tlv320Ai32在輸出音頻時(shí)總有絲絲聲，為什么？

tlv320Ai32在輸出音頻時(shí)總有絲絲聲，即使輸出的濾波將噪聲調(diào)整到90mV以下還是存在。測試發(fā)現(xiàn)HPout的噪聲有將近480mV 請問這是什么原因，Ai32還有什么寄存器要設(shè)置的？模擬電源的紋波大概60mV，有影響嗎？

發(fā)表于 11-05 06:09

聆思CSK6視覺語音大模型AI開發(fā)板入門資源合集（硬件資料、大模型語音/多模態(tài)交互/英語評(píng)測SDK合集）

本帖最后由 jf_40317719 于 2024-6-18 17:39 編輯視覺語音大模型 AI 開發(fā)套件( CSK6-MIX )是圍繞 CSK6011A 芯片設(shè)計(jì)的具備豐富語音圖像功能

發(fā)表于 06-18 17:33

語音降噪的原理

在專業(yè)音頻設(shè)備中，語音降噪是很重要的一個(gè)環(huán)節(jié)。隨著AI人工智能的快速發(fā)展，各種AI人工智能降噪方法應(yīng)運(yùn)而生。

發(fā)表于 06-03 17:21 ?1439次閱讀

3D建模的特點(diǎn)和優(yōu)勢都有哪些？

的應(yīng)用。特點(diǎn)： 1.三維模型化：3D建模允許用戶在虛擬空間內(nèi)創(chuàng)建具有長度、寬度和高度的物體，從而形成真實(shí)感十足的三維模型。 2.精確性：通過3D建模軟件，用戶可以精確地控制對象的尺寸、形狀和位置，確保設(shè)計(jì)的準(zhǔn)確性。 3.可視化

發(fā)表于 05-13 16:41 ?2187次閱讀

USB AI話務(wù)語音降噪音頻方案

發(fā)表于 04-25 18:16 ?506次閱讀

USB <b class='flag-5'>AI</b>話務(wù)<b class='flag-5'>語音</b>降噪<b class='flag-5'>音頻</b>方案

音頻通話產(chǎn)品的福音，數(shù)字語音處理模塊，可消除回音，降低噪聲。

音頻數(shù)字語音

jf_63900430

發(fā)布于 :2024年03月11日 22:37:46

中興努比亞發(fā)布全球首款5G+AI裸眼3D平板

此平板采用Neovison 3D Anytime科技將2D畫面即時(shí)轉(zhuǎn)換為3D效果，增強(qiáng)觀影及音樂娛樂體驗(yàn)的真實(shí)感。較前代產(chǎn)品而言，新設(shè)備在分辨率、亮度和色相等3D性能參數(shù)上都有大幅提升。

發(fā)表于 02-27 14:51 ?637次閱讀

讓機(jī)器擁有說話能力，智能語音與音頻處理SoC

AI，還需要智能語音與音頻處理SoC。 ? 智能語音與音頻處理SoC ? 所謂智能語音與

發(fā)表于 02-02 00:15 ?2546次閱讀

Adobe在Premiere Pro中引入AI音頻編輯功能

Adobe近日宣布，其視頻剪輯軟件Premiere Pro正式引入全新的AI驅(qū)動(dòng)音頻編輯功能。這一創(chuàng)新旨在解放剪輯師的雙手，減少繁瑣的操作，進(jìn)一步提升工作效率。

發(fā)表于 01-19 15:31 ?694次閱讀

英偉達(dá)推出NVIDIA ACE服務(wù)，提供AI模型和微服務(wù)制作虛擬數(shù)字

總而言之，NVIDIA Ace是一個(gè)使機(jī)器人形象具備真實(shí)感乃至情感的創(chuàng)新性技術(shù)平臺(tái)，無論是在云還是個(gè)人PC上都能流暢運(yùn)行。已與之簽約合作的公司有Convai、Charisma.AI、Inworld、米哈游、網(wǎng)易游戲、掌趣科技、騰訊游戲、育碧及UneeQ等。

發(fā)表于 01-09 11:29 ?585次閱讀

在 NVIDIA ACE 中使用 AI 動(dòng)畫和語音功能打造逼真的虛擬形象

NVIDIA 近日公布了 NVIDIA Avatar Cloud Engine（ACE）的一系列技術(shù)，增強(qiáng)了 AI 虛擬形象和數(shù)字人的真實(shí)感和可訪問性，這些新的動(dòng)畫和語音功能實(shí)現(xiàn)了更自然的對話

發(fā)表于 12-15 15:50 ?534次閱讀

在 NVIDIA ACE 中使用 <b class='flag-5'>AI</b> 動(dòng)畫和<b class='flag-5'>語音</b>功能打造逼真的虛擬形象

如何在NVIDIA ACE中使用AI動(dòng)畫和語音功能打造逼真的虛擬形象呢？

NVIDIA 近日公布了 NVIDIA Avatar Cloud Engine（ACE）的一系列技術(shù)，增強(qiáng)了 AI 虛擬形象和數(shù)字人的真實(shí)感和可訪問性，這些新的動(dòng)畫和語音功能實(shí)現(xiàn)了更自然的對話和情感表達(dá)。

發(fā)表于 12-15 15:48 ?607次閱讀

如何在NVIDIA ACE中使用<b class='flag-5'>AI</b>動(dòng)畫和<b class='flag-5'>語音</b>功能打造逼真的虛擬形象呢？

芯知識(shí) | 什么是音頻藍(lán)牙播放語音芯片？

隨著科技的不斷進(jìn)步，音頻藍(lán)牙播放語音芯片成為嵌入式音頻系統(tǒng)中備受關(guān)注的創(chuàng)新解決方案。本文將深入解析什么是音頻藍(lán)牙播放語音芯片，以及其在實(shí)現(xiàn)無

發(fā)表于 12-15 08:36 ?725次閱讀

芯知識(shí) | 什么是<b class='flag-5'>音頻</b>藍(lán)牙播放<b class='flag-5'>語音</b>芯片？

語音數(shù)據(jù)集：AI語音技術(shù)的靈魂

一、引言在人工智能領(lǐng)域，語音技術(shù)被譽(yù)為“未來人機(jī)交互的入口”，而語音數(shù)據(jù)集則是AI語音技術(shù)的靈魂。本文將深入探討語音數(shù)據(jù)集的重要性、構(gòu)建方

發(fā)表于 12-14 14:33 ?945次閱讀

語音數(shù)據(jù)集：推動(dòng)AI語音技術(shù)的核心力量

一、引言隨著人工智能的快速發(fā)展，語音技術(shù)作為人機(jī)交互的重要手段，正發(fā)揮著越來越重要的作用。而語音數(shù)據(jù)集則是推動(dòng)AI語音技術(shù)的核心力量。本文將詳細(xì)介紹

發(fā)表于 12-12 11:32 ?655次閱讀

搜索歷史

AI使用音頻剪輯對與語音匹配的真實(shí)感面部建模

評(píng)論