0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

首例“AI聲音侵權(quán)案”,聲音AI化用于短視頻

Carol Li ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2023-12-20 00:28 ? 次閱讀

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)AI技術(shù)的應(yīng)用,給我們的生活帶來(lái)了巨大改變。同時(shí),它的不當(dāng)使用也帶來(lái)了侵權(quán)、詐騙等風(fēng)險(xiǎn)。近日,北京互聯(lián)網(wǎng)法院首次組成五人合議庭,依法公開(kāi)審理全國(guó)首例“AI聲音侵權(quán)案”。

該案中,原告殷某某以配音為職業(yè),曾錄制多部有聲作品。殷某某意外發(fā)現(xiàn),自己的聲音被AI化后,在一款名為“魔音工坊”的APP上以“魔小璇”的名義對(duì)外出售。因此,殷某某以被告行為侵害其聲音權(quán)為由,將“魔音工坊”的運(yùn)營(yíng)主體北京小問(wèn)智能科技有限公司等五被告起訴到北京互聯(lián)網(wǎng)法院。

AI聲音侵權(quán)案始末

目前,該案件仍在審理中,五被告均否認(rèn)侵權(quán)。北京小問(wèn)智能科技有限公司認(rèn)為,其APP中的聲音產(chǎn)品有合法來(lái)源,來(lái)自于微軟(中國(guó))有限公司。微軟(中國(guó))有限公司稱其使用的聲音來(lái)源于中廣影音(北京)文化傳媒有限公司。

中廣影音(北京)文化傳媒有限公司認(rèn)為其與原告有過(guò)合作,約定經(jīng)原告錄制形成的作品著作權(quán)歸屬其所有。上海藍(lán)云網(wǎng)絡(luò)科技有限公司和北京信諾時(shí)代科技發(fā)展有限公司辯稱,其分別為微軟中國(guó)的平臺(tái)運(yùn)營(yíng)商與涉案產(chǎn)品的經(jīng)銷商,不構(gòu)成侵權(quán)。

原告則認(rèn)為,他人利用原告聲音的配音作品在抖音、直播吧等APP廣泛流傳,其中抖音用戶“小禾侃劇”自2021年9月7日至今,共發(fā)布使用原告聲音的作品119部。經(jīng)聲音篩選和溯源,發(fā)現(xiàn)上述聲音作品中的聲音來(lái)自于被告北京小問(wèn)智能科技有限公司運(yùn)營(yíng)的“魔音工坊”APP。

被告中廣影音(北京)文化傳媒有限公司將原告為其錄制的3本書的音頻交給被告微軟(中國(guó))有限公司,被告微軟(中國(guó))有限公司將原告的聲音進(jìn)行AI化處理,并向被告上海藍(lán)云網(wǎng)絡(luò)科技有限公司和被告北京信諾時(shí)代科技發(fā)展有限公司授權(quán)對(duì)外出售。

但是,原告從未授權(quán)過(guò)任何第三人將其錄制的聲音進(jìn)行AI化并對(duì)外銷售,上述被告的行為已經(jīng)嚴(yán)重侵犯了原告的聲音權(quán),應(yīng)承擔(dān)停止侵權(quán)、賠禮道歉及賠償原告經(jīng)濟(jì)損失、精神損失的侵權(quán)責(zé)任。

北京小問(wèn)智能科技有限公司是出門問(wèn)問(wèn)旗下公司,魔音工坊是出門問(wèn)問(wèn)面向AI配音場(chǎng)景推出的新一代AI配音產(chǎn)品。在大模型技術(shù)的加持下,“魔音工坊”是全球首款搭載了大模型AI寫作功能的配音平臺(tái),覆蓋了AI寫作、AI配音和剪輯等多個(gè)場(chǎng)景。用戶可以在它的輔助下輕松完成影視解說(shuō)、有聲書、在線教育、新聞播報(bào)等集文案與配音于一體的內(nèi)容創(chuàng)作。

如今,短視頻、有聲書市場(chǎng)蓬勃發(fā)展,這也使得聲音合成技術(shù)有了廣泛的應(yīng)用空間。在應(yīng)用市場(chǎng)和深度學(xué)習(xí)技術(shù)的發(fā)展下,語(yǔ)音合成技術(shù)已經(jīng)非常成熟??梢钥吹缴鲜銮闆r是,原告給某公司錄過(guò)幾本書,它的聲音在沒(méi)被授權(quán)的情況下通過(guò)AI化之后,進(jìn)行出售。

這其實(shí)就是現(xiàn)在大家談到的聲音克隆,也稱為語(yǔ)音合成定制,是一種深度學(xué)習(xí)算法。平臺(tái)方可以通過(guò)各種渠道獲得某人的聲音之后,哪怕這個(gè)人只是說(shuō)了幾段話,通過(guò)AI技術(shù)都可以合成與原說(shuō)話人非常相似的聲音。

語(yǔ)音合成歷史及應(yīng)用趨勢(shì)

語(yǔ)音合成,又稱文語(yǔ)轉(zhuǎn)換(Text to Speech)技術(shù),能將任意文字信息實(shí)時(shí)轉(zhuǎn)化為標(biāo)準(zhǔn)流暢的語(yǔ)音朗讀出來(lái),相當(dāng)于給機(jī)器裝上了人工嘴巴。它涉及聲學(xué)、語(yǔ)言學(xué)、數(shù)字信號(hào)處理、計(jì)算機(jī)科學(xué)等多個(gè)學(xué)科技術(shù),是中文信息處理領(lǐng)域的一項(xiàng)前沿技術(shù),解決的主要問(wèn)題就是如何將文字信息轉(zhuǎn)化為可聽(tīng)的聲音信息,也即讓機(jī)器像人一樣開(kāi)口說(shuō)話。

事實(shí)上,早在18到19世紀(jì),語(yǔ)音合成技術(shù)就已經(jīng)出現(xiàn),當(dāng)時(shí)是用機(jī)械裝置來(lái)模擬人的發(fā)聲,那時(shí)候科學(xué)家們會(huì)制作出一些精巧的氣囊和風(fēng)箱去搭建發(fā)聲的系統(tǒng),可以合成出一些元音和單音。20世紀(jì)初,出現(xiàn)了用電子合成器來(lái)模擬人發(fā)聲的技術(shù),最具代表性的就是貝爾實(shí)驗(yàn)室的Dudley,他在1939年推出了名為“VODER”的電子發(fā)聲器,使用電子器件來(lái)模擬聲音的諧振。

到了20世紀(jì)80年代,隨著集成電路技術(shù)的發(fā)展,出現(xiàn)了比較復(fù)雜的組合型的電子發(fā)生器,比較代表性的KLATT在1980年發(fā)布的串/并聯(lián)混合共振峰合成器。到了20世紀(jì)80、90年代隨著PSOLA方法的提出和計(jì)算機(jī)能力的發(fā)展,單元挑選和波形拼接技術(shù)逐漸走向成熟,90年代末劉慶峰博士提出聽(tīng)感量化思想,首次將中文語(yǔ)音合成技術(shù)做到了實(shí)用化地步。

在20世紀(jì)末期,還有另外一種基于HMM的參數(shù)合成技術(shù)出現(xiàn)。而近些年,隨著AI技術(shù)不斷發(fā)展,基于深度學(xué)習(xí)的語(yǔ)音合成技術(shù)逐漸被人們所知道,DNN/CNN/RNN等各種神經(jīng)網(wǎng)絡(luò)構(gòu)型都可以用來(lái)做語(yǔ)音合成系統(tǒng)的訓(xùn)練,深度學(xué)習(xí)的算法可以更好地模擬人聲變化規(guī)律。語(yǔ)音合成技術(shù)應(yīng)用也迎來(lái)了高速發(fā)展。

當(dāng)下,AI聲音合成技術(shù)的市場(chǎng)需求確實(shí)非常明顯。直播、短視頻、有聲書的市場(chǎng)需求空間大,然而未接受過(guò)聲音培訓(xùn)的普通人對(duì)于自己的聲音滿意度并不高。而通過(guò)AI技術(shù)讓配音,或者美化自己的聲音正在成為趨勢(shì)。上文提到的魔音工坊正是通過(guò)技術(shù)手段為用戶提供好聽(tīng)的聲音。

小結(jié)

當(dāng)前來(lái)說(shuō),AI技術(shù)侵權(quán)的問(wèn)題仍然還未得到解決,就如之前使用圖片所有權(quán)人的圖片進(jìn)行訓(xùn)練,生成的圖片,這是否構(gòu)成對(duì)圖片所有權(quán)人的圖片的侵權(quán)。聲音訓(xùn)練也是如此,使用某人的聲音訓(xùn)練出了跟這個(gè)人類似的聲音,這個(gè)合成的聲音所有權(quán)算誰(shuí)的?這些還需要進(jìn)一步探討出相應(yīng)的規(guī)范才行。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29806

    瀏覽量

    268106
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    首例AI機(jī)器人致死震驚全球

    AI機(jī)器人的安全性、友好性、是否符合積極正面的價(jià)值導(dǎo)向一直被質(zhì)疑,現(xiàn)在在佛羅里達(dá)州出現(xiàn)了一例AI聊天機(jī)器人對(duì)青少年人身安全造成威脅的現(xiàn)實(shí)案例。這也是已知的AI技術(shù)出現(xiàn)以來(lái)第一次對(duì)青少年人身安全造成
    的頭像 發(fā)表于 10-25 16:32 ?625次閱讀

    知網(wǎng)狀告AI搜索:搜到我家論文題目和摘要,你侵權(quán)了!

    創(chuàng)業(yè)團(tuán)隊(duì)秘塔AI搜索,被知網(wǎng)給告了!足足28頁(yè)的侵權(quán)告知函,總結(jié)一句話就是:貴司的AI搜索,能搜到我家的學(xué)術(shù)文獻(xiàn)題錄及摘要數(shù)據(jù),且沒(méi)經(jīng)我司許可,嚴(yán)重侵權(quán)。
    的頭像 發(fā)表于 08-16 17:47 ?258次閱讀
    知網(wǎng)狀告<b class='flag-5'>AI</b>搜索:搜到我家論文題目和摘要,你<b class='flag-5'>侵權(quán)</b>了!

    云開(kāi)發(fā)AI助手

    AI
    草帽王路飛
    發(fā)布于 :2024年07月22日 14:41:54

    視頻3--場(chǎng)景自動(dòng)化AI助手

    AI
    草帽王路飛
    發(fā)布于 :2024年07月22日 11:16:13

    視頻2--場(chǎng)景自動(dòng)化AI助手

    AI
    草帽王路飛
    發(fā)布于 :2024年07月22日 11:15:34

    EPSON公司發(fā)布帶有專用于2聲道聲音聲音硬件的32位微控制器

    EPSON愛(ài)普生半導(dǎo)體公司已開(kāi)始出貨S1C31D50的樣品,S1C31D50是一種32位微控制器,帶有專用于2聲道聲音聲音硬件。愛(ài)普生計(jì)劃每個(gè)型號(hào)每月生產(chǎn)200,000件。在家用電子產(chǎn)品,家用電器
    的頭像 發(fā)表于 07-17 10:30 ?377次閱讀
    EPSON公司發(fā)布帶有專<b class='flag-5'>用于</b>2聲道<b class='flag-5'>聲音</b>的<b class='flag-5'>聲音</b>硬件的32位微控制器

    聲音測(cè)量的定義和典型應(yīng)用

    一、什么是聲音測(cè)量?聲音測(cè)量是聲學(xué)測(cè)量的一種。聲學(xué)測(cè)量是研究聲學(xué)測(cè)量技術(shù)的科學(xué),包括測(cè)量方法和測(cè)量?jī)x器。基本的聲學(xué)測(cè)量包括聲強(qiáng)測(cè)量、聲質(zhì)點(diǎn)速度測(cè)量、波長(zhǎng)測(cè)量、加速度測(cè)量、傳聲器和水聽(tīng)器絕對(duì)校準(zhǔn)、通信
    的頭像 發(fā)表于 06-29 08:31 ?1007次閱讀
    <b class='flag-5'>聲音</b>測(cè)量的定義和典型應(yīng)用

    微軟與OpenAI聯(lián)手打造聲音識(shí)別AI技術(shù)專利

    這款創(chuàng)新的系統(tǒng)旨在通過(guò)辨別環(huán)境音響,為使用者提供潛在風(fēng)險(xiǎn)預(yù)警,對(duì)于公共安全及災(zāi)害預(yù)控領(lǐng)域具有不可估量的價(jià)值。它的關(guān)鍵技術(shù)在于對(duì)聲音信號(hào)的深度分析與處理。
    的頭像 發(fā)表于 04-09 15:55 ?288次閱讀

    [技術(shù)干貨](méi)?MoneyPrinterTurbo,利用 AI 大模型,一鍵生成高清短視頻

    開(kāi)始使用 步驟 1?訪問(wèn)該促銷活動(dòng)購(gòu)買頁(yè)面,按照如下配置完成 AI 生成短視頻服務(wù)器的部署。 步驟 2?登錄彈性云服務(wù)器控制臺(tái)。使用 Linux 連接工具登錄服務(wù)器,或者在控制臺(tái)單擊“遠(yuǎn)程登錄
    的頭像 發(fā)表于 04-07 15:11 ?1405次閱讀
    [技術(shù)干貨](méi)?MoneyPrinterTurbo,利用 <b class='flag-5'>AI</b> 大模型,一鍵生成高清<b class='flag-5'>短視頻</b>

    NanoEdge AI的技術(shù)原理、應(yīng)用場(chǎng)景及優(yōu)勢(shì)

    NanoEdge AI 是一種基于邊緣計(jì)算的人工智能技術(shù),旨在將人工智能算法應(yīng)用于物聯(lián)網(wǎng)(IoT)設(shè)備和傳感器。這種技術(shù)的核心思想是將數(shù)據(jù)處理和分析從云端轉(zhuǎn)移到設(shè)備本身,從而減少數(shù)據(jù)傳輸延遲、降低
    發(fā)表于 03-12 08:09

    Stability AI與Morph AI共同推出一體化AI視頻創(chuàng)作工具

    近日,業(yè)界領(lǐng)先的AI技術(shù)公司Stability AI與中國(guó)AI創(chuàng)業(yè)公司Morph AI達(dá)成重要合作。雙方宣布共同推出一款革新性的all-in-one(一體式)
    的頭像 發(fā)表于 03-05 10:44 ?811次閱讀

    首例虛擬數(shù)字人侵權(quán)案判決!數(shù)字人面臨的挑戰(zhàn)及發(fā)展趨勢(shì)

    網(wǎng)絡(luò)平臺(tái)上有超過(guò)5000萬(wàn)個(gè)虛擬數(shù)字人的主播賬號(hào),相關(guān)的市場(chǎng)規(guī)模已經(jīng)達(dá)到一百余億元,周邊市場(chǎng)更是超過(guò)了千億元的量級(jí)。 ? 然而隨著市場(chǎng)規(guī)模的不斷發(fā)展擴(kuò)大,相關(guān)的糾紛也隨之而來(lái)。全國(guó)首例涉“虛擬數(shù)字人”侵權(quán)案近日二審宣判引
    的頭像 發(fā)表于 01-15 00:01 ?1490次閱讀

    讓“聾人”看到聲音 行空板 —“AI助聽(tīng)器”

    世界上有各種各樣的殘障人士,這些人或不能說(shuō)話,或聽(tīng)不見(jiàn)聲音。聾人,是聽(tīng)力因先天遺傳或后天人為因素而受損的殘疾人,也叫聽(tīng)力障礙者,簡(jiǎn)稱聽(tīng)障人。根據(jù)最近的全國(guó)人口普查統(tǒng)計(jì),全中國(guó)大約有2700多萬(wàn)聽(tīng)障人
    的頭像 發(fā)表于 01-12 13:12 ?382次閱讀

    labview聲音采集與處理

    LabVIEW是一種用于數(shù)據(jù)采集與處理的編程語(yǔ)言和開(kāi)發(fā)環(huán)境。它具有強(qiáng)大的聲音采集和處理功能,可以幫助用戶實(shí)現(xiàn)聲音信號(hào)的采集、分析和處理。本文將詳細(xì)介紹LabVIEW在聲音采集與處理方面
    的頭像 發(fā)表于 01-04 10:48 ?2104次閱讀

    炬芯科技周正宇:煥新聲音活力,AI驅(qū)動(dòng)下的音頻芯片創(chuàng)新

    人類高度依賴對(duì)聲音的感知,從某些角度出發(fā)甚至高于對(duì)于視覺(jué)的依賴。海倫凱勒說(shuō):盲隔離人和物,聾隔離人和人??梢哉f(shuō)聲音是人與人交互最重要的手段。人對(duì)聲音的高度依賴從生到死永不停息,耳朵是一生從不
    發(fā)表于 11-16 11:56 ?204次閱讀
    炬芯科技周正宇:煥新<b class='flag-5'>聲音</b>活力,<b class='flag-5'>AI</b>驅(qū)動(dòng)下的音頻芯片創(chuàng)新