0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI精確復制聲音, 真假“比爾·蓋茨”難辨

Gv1N_smartman16 ? 來源:yxw ? 2019-06-15 10:44 ? 次閱讀

近日, 臉書的研究人員成功克隆了微軟總裁比爾·蓋茨的聲音。

臉書人工智能研究中心的肖恩·瓦斯奎茲(Sean Vasquez)和邁克·劉易斯(Mike Lewis)于本周表示,他們已經努力模仿人類語言有一段時間了。然而,模仿人類語言顯然是件難事,當人們聽到斯蒂芬·霍金所使用的那套最著名的說話機器發(fā)聲時,會發(fā)現它聽起來仍然很不像人類。

但是現在,研究員們似乎已經取得了進展。如果你聽了蓋茨的克隆所發(fā)出的聲音,我想你是會同意的。因為它聽起來很像比爾·蓋茨,你甚至很難分辨出它和他真實聲音的區(qū)別。

研究人員展示了他們的研究。在這里,機器模仿著蓋茨的腔調發(fā)聲,“請給你珍愛的朋友發(fā)一封充滿愛意的短信?!逼渲凶畈豢伤甲h的是,這臺機器在說“珍愛(cherish)”時,準確無誤地捕捉到蓋茨不斷上升的語調變化的。

這項技術被稱為MelNet,可以用來復制人類的語調。到目前為止,蓋茨和其他許多人的聲音都被它完美地再現了。瓦斯奎茲和劉易斯說,克隆的音頻取自各類Ted演講。

兩位研究人員還表示,直到最近,文本到語音轉換軟件還不能很好地工作的原因是它使用了波形圖記錄聲音。這些圖顯示了聲音在幾秒鐘內的音階變化。如果你聽到過蓋茨說“珍愛”這個詞,就知道他的語氣是變化劇烈的。在試圖模仿一個人的時候,深度學習機器必須預測到所有這些細微的變化,這很不容易。

瓦斯奎茲和劉易斯說,他們通過使用一種叫做光譜圖的東西來訓練機器,成功地克隆了聲音。

研究人員說:“光譜圖的時間軸比波形圖的時間軸緊湊幾個數量級,這意味著在波形中跨越數萬個時間步長的依賴關系在光譜圖中只跨越數百個時間步長。這使得我們的光譜圖模型能夠在數秒內記錄各種語音和音樂樣本,并保持它們一致性。”

不過,他們也經歷了一些挫折。研究小組表示,對他們來說,幾乎完美地復制一個句子并不難,難的是復制那些在長達幾十秒或幾分鐘的時間里,顯示了情緒變化的復雜語調”。盡管如此,當涉及到人機交互時,研究小組說,在只涉及簡短對話的情境中,這項技術可能會帶來革命性的變化。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    28877

    瀏覽量

    266236
  • 機器學習
    +關注

    關注

    66

    文章

    8306

    瀏覽量

    131845
  • 智能語音
    +關注

    關注

    10

    文章

    771

    瀏覽量

    48595

原文標題:AI精確復制聲音, 真假“比爾·蓋茨”難辨

文章出處:【微信號:smartman163,微信公眾號:網易智能】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    如何搭建一個電流鏡電路,用于復制SiPM的電流?

    范圍大約為4mA~400mA。 如上圖所示,這是一個SiPM的讀出的ASIC電路結構。圖中電流鏡能夠對SiPM的電流進行復制,并且可以按照一定比例縮小;我只需要進行精確復制,請問Ti有合適的器件嗎?
    發(fā)表于 08-02 07:38

    三星電容代理商怎么辨別真假呢?

    三星電容代理商 所代理產品辨別真假的方式有兩種,一種是先辨別 三星電容代理商 的真假,另一種就是根據三星電容的產品防偽標志來進行辨別真假。今天針對這兩種方式給大家詳細的分享一下如何去針對這兩種方式
    的頭像 發(fā)表于 07-25 15:37 ?173次閱讀

    比爾·蓋茨展望AI:耳機與智能眼鏡引領人機交互新紀元

    在科技日新月異的今天,每一次技術的飛躍都預示著生活方式的深刻變革。7月4日,微軟公司的聯合創(chuàng)始人比爾·蓋茨,這位科技界的傳奇人物,在《下一個偉大的構想》播客節(jié)目中,以其獨到的視角和前瞻性的思考,為
    的頭像 發(fā)表于 07-04 16:34 ?719次閱讀

    比爾·蓋茨展望AI未來:從AI顧問到深度智能體的演變

    在科技日新月異的今天,人工智能(AI)作為引領未來變革的關鍵力量,其發(fā)展前景始終牽動著全球科技界與公眾的神經。近日,微軟創(chuàng)始人比爾·蓋茨在知名播客節(jié)目《Next Big Idea Club》上,就
    的頭像 發(fā)表于 07-03 16:10 ?313次閱讀

    比爾·蓋茨斥資數十億美元,啟動未來核電站項目

    在全球能源需求日益增長,而環(huán)保呼聲日益高漲的當下,比爾·蓋茨的又一重要戰(zhàn)略布局備受矚目。6月17日,據外媒報道,微軟創(chuàng)始人比爾·蓋茨在公開場合宣布,他準備在美國懷俄明州投入數十億美元,
    的頭像 發(fā)表于 06-17 16:08 ?375次閱讀

    比爾·蓋茨在微軟仍掌握關鍵影響力

    據悉,蓋茨曾在2017年組織高層會晤,參與者包括時任CEO薩蒂亞·納德拉及多位高管。會上,蓋茨提出了“AI代理人”的概念,認為它們將超越Siri和Alexa,成為強大的個人助手,引領新世界秩序。這一觀點促使微軟與OpenAI建立
    的頭像 發(fā)表于 04-30 11:13 ?501次閱讀

    ad復制元件怎么保持編號不變

    復制AD(AutoCAD)元件時,如果要保持編號不變,可以按照以下步驟進行操作: 創(chuàng)建一個元件庫:首先,你需要創(chuàng)建一個元件庫,將你要復制的原始元件添加到庫中。你可以使用AD軟件的“設計中心”或“內容
    的頭像 發(fā)表于 12-27 17:07 ?5784次閱讀

    首例“AI聲音侵權案”,聲音AI化用于短視頻

    電子發(fā)燒友網報道(文/李彎彎)AI技術的應用,給我們的生活帶來了巨大改變。同時,它的不當使用也帶來了侵權、詐騙等風險。近日,北京互聯網法院首次組成五人合議庭,依法公開審理全國首例“AI聲音侵權案
    的頭像 發(fā)表于 12-20 00:28 ?1568次閱讀

    周禮棟對話比爾·蓋茨:深入的科學研究比以往任何時候都更加重要

    特別策劃了“智匯對話”系列內容,邀請全球各領域頂尖專家學者,與微軟亞洲研究院院長周禮棟博士共同暢談研究文化,探討跨學科創(chuàng)新,展望技術未來。 2023年6月,微軟聯合創(chuàng)始人比爾·蓋茨來到微軟亞洲研究院,與微軟亞洲研究院院長周禮棟
    的頭像 發(fā)表于 12-12 15:55 ?267次閱讀
    周禮棟對話<b class='flag-5'>比爾</b>·<b class='flag-5'>蓋茨</b>:深入的科學研究比以往任何時候都更加重要

    新火種AI比爾蓋茨表態(tài):生成式AI已成過去接下來是可解釋AI的天下

    作者:小巖 編輯:彩云 根據財聯社消息,11月28日,比爾·蓋茨針對AI未來的發(fā)展趨勢發(fā)表了自己的看法。他認為,當下生成式AI的發(fā)展已經達到了極限,很難再有突破性的進展。下一個
    的頭像 發(fā)表于 12-06 10:36 ?670次閱讀
    新火種<b class='flag-5'>AI</b>|<b class='flag-5'>比爾蓋茨</b>表態(tài):生成式<b class='flag-5'>AI</b>已成過去接下來是可解釋<b class='flag-5'>AI</b>的天下

    mysql主從復制 混合類型的復制

    MySQL主從復制是一種常用的數據復制技術,可以實現數據從一個MySQL服務器(主服務器)復制到另一個MySQL服務器(從服務器)。在主從復制中,混合類型的
    的頭像 發(fā)表于 11-16 14:20 ?447次閱讀

    mysql主從復制的原理

    MySQL主從復制是一種數據庫復制技術,它允許將一個MySQL數據庫的更新操作自動復制到其他MySQL數據庫上的過程。主要通過MySQL的binlog(二進制日志)和relay log(中繼日志)來
    的頭像 發(fā)表于 11-16 14:18 ?404次閱讀

    在語音時代,聲音深度假音如何分辨?

    聲音深度假音的創(chuàng)造植根于復雜的人工智能系統,尤其是自動編碼器,它可以捕捉和復制人類語言的微妙之處。這些系統不只是克隆聲音;他們分析和重現情感變化和特定的語調,使每個聲音都獨一無二。
    的頭像 發(fā)表于 11-14 16:04 ?566次閱讀

    史陶比爾推出新一代AGV-CC6充電連接器

    史陶比爾在移動機器人充電連接領域擁有豐富的應用經驗,產品覆蓋從小型倉儲AGV/AMR到大型港口AGV/ART的應用。 得益于先進的MULTILAM技術,史陶比爾充電連接產品具有極低的接觸電阻,持久穩(wěn)定的連接性能。
    發(fā)表于 10-25 09:43 ?724次閱讀

    什么是Redis主從復制

    Redis主從復制 來自靈魂的拷問:什么是Redis主從復制? 簡言之就是: 主對外從對內,主可寫從不可寫 主掛了,從不可為主 看下面的圖加深下理解: 對,你沒看錯,Redis主從復制沒有動態(tài)選舉
    的頭像 發(fā)表于 10-09 15:09 ?350次閱讀
    什么是Redis主從<b class='flag-5'>復制</b>