0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI Deepfake再升級,以假亂真!安全性令人擔(dān)憂

WpOh_rgznai100 ? 來源:YXQ ? 2019-06-12 13:54 ? 次閱讀

眾所周知,利用 Deepfake 技術(shù)可以自動生成虛假圖像,輕松達(dá)到以假亂真的結(jié)果。但這還不夠,隨著該技術(shù)的不斷升級,它還有更多意想不到的應(yīng)用正在被挖掘?,F(xiàn)在,一個能更加方便快捷創(chuàng)建虛假視頻和錯誤信息的方法出現(xiàn)了。

最新的深度技術(shù)突破中,研究人員展示了一種新方法,該方法使用機(jī)器學(xué)習(xí)技術(shù)讓用戶編輯視頻文本內(nèi)容,來添加、刪除或更改視頻人物中的話語。

也就是說,如果你想對一段人物特寫視頻進(jìn)行重新編輯,只需要對視頻所對應(yīng)的文本內(nèi)容進(jìn)行修改,隨后人臉會根據(jù)修改的文本內(nèi)容作出與之相配的動作表達(dá)。

研究人員在一段視頻講解中給出了一些例子,比如將電影《現(xiàn)代啟示錄》中的一段人物特寫鏡頭中的臺詞“我喜歡早晨的汽油彈的氣味”更改為“我喜歡早晨的法國土司的味道?!彪S著臺詞的變化,系統(tǒng)自動會重新合成人物的臉部發(fā)聲動作,給出編輯后的視頻。

這項研究由斯坦福大學(xué)、馬克斯普朗克信息學(xué)研究所、普林斯頓大學(xué)和 Adobe 研究所的科學(xué)家共同合作完成,它表明人們能夠更輕松地編輯視頻人物所說的內(nèi)容并制作逼真的虛假視頻。

研究人員認(rèn)為,他們的方法完全朝著基于文本編輯和合成一般視聽內(nèi)容的目標(biāo)邁出了重要一步。

不過,該方法目前正處于研究階段,普通用戶還不能使用,但市面上已經(jīng)有類似的軟件。Adobe 就發(fā)布了一個叫 VoCo 原型軟件,該方法允許用戶像編輯圖片一樣輕松編輯語音內(nèi)容。

但該系統(tǒng)給出的結(jié)果要更加精細(xì)。根據(jù)論文《基于文本的頭部特寫視頻編輯》(https://www.ohadf.com/projects/text-based-editing/data/text-based-editing.pdf)介紹,該系統(tǒng)的輸入包括講話的頭部特寫視頻、講話的文本和指定的編輯操作,他們的工具支持三種類型的編輯操作:

增加新單詞:編輯器在視頻中的某一點添加一個或多個連續(xù)的單詞。

重新排列現(xiàn)有的單詞:編輯移動一個或多個存在于視頻中的單詞。

刪除現(xiàn)有單詞:編輯從視頻中刪除一個或多個單詞。

為了做出虛假視頻,研究者們主要分為五個階段來處理視頻。在音位排列階段,他們將轉(zhuǎn)錄文本與視頻進(jìn)行比對,然后在跟蹤重建階段,用視頻生成了一個三維參數(shù)頭部模型。每個輸入視頻完成這樣的預(yù)處理步驟,然后執(zhí)行視位搜索(viseme search),在編輯器中找到音素的子序列和輸入視頻中音素的子序列之間的最佳視覺匹配。研究者們還提取了編輯位置周圍的區(qū)域作為背景序列,從中提取背景像素和姿態(tài)數(shù)據(jù)。對于每個子序列他們混合三維頭部模型的參數(shù),然后加上背景像素,最終呈現(xiàn)一個真實的全畫幅視頻(full-frame video)。

(注:視覺音素 / 視素(visual phoneme/viseme)是嘴唇和面部的姿勢或表達(dá),其對應(yīng)于特定的語音(音素),是具備可理解度的基本視覺單元。在計算機(jī)動畫中,我們可以使用視覺音素來制作虛擬角色的動作,令它們看起來像是在說話。)

當(dāng)有人編輯視頻的文本內(nèi)容時,系統(tǒng)會將所有這些收集的數(shù)據(jù)(音素、視位和 3D 臉部模型)組合在一起,以構(gòu)建與文本輸入相匹配的新素材,然后將其粘貼到源視頻上以創(chuàng)建最終的結(jié)果。

研究人員還將他們的方法與其他對講視頻合成技術(shù)進(jìn)行了比較。他們分別用 5% 、10%、50% 和 100% 的訓(xùn)練數(shù)據(jù)來測試結(jié)果。使用 100% 的數(shù)據(jù)量,每幅圖像的平均 RMSE(標(biāo)準(zhǔn)誤差) 為 0.018,使用 50% 的數(shù)據(jù)量為 0.019,只使用 5%的數(shù)據(jù)量為 0.021 。

他們還用各種合成短語進(jìn)行測試,發(fā)現(xiàn)短語長度與結(jié)果質(zhì)量沒有直接關(guān)系。而組成短語的視位和音素對齊質(zhì)量等其他因素會影響最終結(jié)果。

他們還嘗試將 MorphCut 應(yīng)用于單詞的加法問題。MorphCut 在兩幀圖像之間產(chǎn)生一個大的頭部跳躍。

將檢索到的viseme序列與MorphCut拼起來生成一個新單詞

同時,他們與 Face2Face[Thiesetal.2016]方法進(jìn)行了比較,他們的方法生成了高質(zhì)量結(jié)果,而基于檢索的 Face2Face 方法顯示出鬼影現(xiàn)象,并且不穩(wěn)定。

與 Face2Face 進(jìn)行比較

為了定量評估基于文本的編輯系統(tǒng)生成的視頻質(zhì)量,研究人員發(fā)起了一項基于 web 的用戶測試研究,參與者有 138 名。

在向 138 名志愿者進(jìn)行虛假視頻的測試時,大約 60% 的參與者認(rèn)為編輯過的視頻是真實的,雖然這個數(shù)據(jù)聽起來不怎么好,但另一數(shù)據(jù)顯示,同一組內(nèi)只有 80% 的參與者認(rèn)為原始未經(jīng)編輯的鏡頭才是合理的。(研究人員指出,這可能是因為一些人在測試前被告知他們的答案會用于視頻編輯研究,這意味著受試者已經(jīng)準(zhǔn)備好要找到虛假視頻。)

以上評估表明,他們的方法展示了令人信服的結(jié)果,但該研究也存在一定的局限性,還有進(jìn)一步優(yōu)化的空間。

例如,新的合成方法需要重新計時(re-timed)的背景視頻作為輸入,但重新計時會改變動作的速度,因此眨眼和手勢可能不再與講話動作完全一致,為了減少這種影響,他們使用了比實際編輯更長的重新計時區(qū)間以修改更多原始視頻片段。

這里的算法只能用于對特寫風(fēng)格的視頻施加影響,并且這需要 40 分鐘的輸入數(shù)據(jù)。編輯過的語音似乎與源材料的差別不大,并且在最優(yōu)質(zhì)的虛假視頻中,研究人員要求拍攝對象錄制新的音頻以匹配這種變化,然后用 AI 生成視頻。

研究人員還指出,他們還不能改變?nèi)宋镎f話聲音的情緒或語調(diào),因為這樣做會產(chǎn)生“不可思議的結(jié)果”,例如,如果人物在說話時揮手對臉部進(jìn)行遮擋會讓算法完全失效。

在未來,研究人員指出,端到端學(xué)習(xí)可以用來學(xué)習(xí)一種從文本到視聽內(nèi)容的直接映射。

這些局限性始終存在于早期研究中,不過研究人員可以保證它們能夠及時得到克服,這意味著任何人都可以在沒有技術(shù)培訓(xùn)的情況下使用系統(tǒng)來編輯人們在視頻中所說的內(nèi)容。

這項技術(shù)的潛在危害非常令人擔(dān)憂,該領(lǐng)域的研究人員經(jīng)常因未能考慮可能濫用其研究而受到批評。但參與這一特定項目的科學(xué)家表示,他們已經(jīng)考慮過這些問題。

在這篇論文附帶的博客文章中,他們寫道:“雖然圖像和視頻處理的方法與媒介本身一樣久遠(yuǎn),但當(dāng)其應(yīng)用于思想和意圖等權(quán)威證據(jù)的交流方式時,濫用的風(fēng)險會更高?!八麄円渤姓J(rèn),不法分子可能會使用此類技術(shù)偽造個人陳述并用于誹謗知名人士。

為了防止人們混淆原始視頻和虛假視頻,他們給出的解決方案是人工智能編輯的視頻應(yīng)該通過使用水印或通過上下文直接清楚地呈現(xiàn)(例如觀眾理解他們正在觀看的是虛構(gòu)電影)。

但顯然,The Verge 指出,水印很容易被消除,而且網(wǎng)絡(luò)媒體在傳播會去掉上下文場景描述,虛假事物并不需要完美無瑕。很多虛假的新聞文章很容易被揭穿,但這并不能阻止它們的傳播,尤其是對于那些想要相信這種符合他們先入之見的謊言的社區(qū)。

當(dāng)然,這樣的技術(shù)也有許多有益的用途,比如對電影和電視行業(yè)有很大的幫助,可以讓他們在不重新錄制鏡頭的情況下修復(fù)讀錯的臺詞,并幫助不同語言的演員進(jìn)行無縫配音。不過,與潛在的濫用等威脅相比,這些益處好像并不足以使人們信任這項技術(shù),反而,它在技術(shù)上的突破更大,人們會更加感到不安。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29806

    瀏覽量

    268103

原文標(biāo)題:“篡改”視頻腳本,讓特朗普輕松“變臉”?AI Deepfake再升級

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    AI即服務(wù)平臺的安全性分析

    AIaaS平臺降低AI應(yīng)用門檻,但面臨數(shù)據(jù)泄露、惡意攻擊等安全威脅。需加強(qiáng)數(shù)據(jù)加密、訪問控制、模型加固、供應(yīng)鏈安全等措施,確保合法合規(guī),提供安全可靠的
    的頭像 發(fā)表于 11-07 09:32 ?69次閱讀

    socket編程的安全性考慮

    在Socket編程中,安全性是一個至關(guān)重要的考慮因素。以下是一些關(guān)鍵的安全性考慮和措施: 1. 數(shù)據(jù)加密 使用TLS/SSL協(xié)議 :TLS/SSL(傳輸層安全性/安全套接層)是網(wǎng)絡(luò)
    的頭像 發(fā)表于 11-01 16:46 ?153次閱讀

    UWB模塊的安全性評估

    UWB(超寬帶)模塊的安全性評估是一個復(fù)雜而關(guān)鍵的過程,涉及多個方面,包括技術(shù)特性、加密機(jī)制、抗干擾能力、物理層安全等。以下是對UWB模塊安全性評估的分析: 一、技術(shù)特性帶來的安全性
    的頭像 發(fā)表于 10-31 14:17 ?104次閱讀

    智能系統(tǒng)的安全性分析

    智能系統(tǒng)的安全性分析是一個至關(guān)重要的過程,它涉及多個層面和維度,以確保系統(tǒng)在各種情況下都能保持安全、穩(wěn)定和可靠。以下是對智能系統(tǒng)安全性的分析: 一、數(shù)據(jù)安全性 數(shù)據(jù)加密 : 采用對稱加
    的頭像 發(fā)表于 10-29 09:56 ?168次閱讀

    云計算安全性如何保障

    云計算的安全性是一個復(fù)雜而多維的問題,涉及多個層面和多種技術(shù)手段。為了保障云計算的安全性,需要采取一系列綜合措施,以下是具體的保障方法: 一、數(shù)據(jù)加密 數(shù)據(jù)加密是保護(hù)云計算安全性的核心手段之一
    的頭像 發(fā)表于 10-24 09:14 ?155次閱讀

    恒訊科技分析:IPSec與SSL/TLS相比,安全性如何?

    IPSec和SSL/TLS都是用于保護(hù)網(wǎng)絡(luò)通信安全的協(xié)議,但它們在實現(xiàn)方式、安全性側(cè)重點、兼容以及使用場景上存在一些顯著的區(qū)別。1、安全性方面:IPSec主要關(guān)注網(wǎng)絡(luò)層的
    的頭像 發(fā)表于 10-23 15:08 ?211次閱讀
    恒訊科技分析:IPSec與SSL/TLS相比,<b class='flag-5'>安全性</b>如何?

    固態(tài)電池安全性怎么樣

    固態(tài)電池在安全性方面表現(xiàn)出顯著的優(yōu)勢,這主要得益于其獨特的固態(tài)電解質(zhì)結(jié)構(gòu)。以下是對固態(tài)電池安全性的詳細(xì)分析:
    的頭像 發(fā)表于 09-15 11:47 ?426次閱讀

    利用JTAGLOCK特性增強(qiáng)設(shè)備安全性

    電子發(fā)燒友網(wǎng)站提供《利用JTAGLOCK特性增強(qiáng)設(shè)備安全性.pdf》資料免費下載
    發(fā)表于 09-14 10:06 ?0次下載
    利用JTAGLOCK特性增強(qiáng)設(shè)備<b class='flag-5'>安全性</b>

    請問DM平臺訪問安全性如何控制?

    DM平臺訪問安全性如何控制?
    發(fā)表于 07-25 06:10

    NFC風(fēng)險與安全性:揭示NFC技術(shù)高安全性的真相

    在數(shù)字化日益普及的今天,NFC(近場通信)技術(shù)因其便捷和高效而被廣泛應(yīng)用。然而,當(dāng)提及NFC時,一些人可能會聯(lián)想到潛在的風(fēng)險。本文將深入探討NFC風(fēng)險,并強(qiáng)調(diào)其高安全性的特性,揭示NFC技術(shù)在
    的頭像 發(fā)表于 06-29 13:03 ?873次閱讀

    藍(lán)牙模塊的安全性與隱私保護(hù)

    藍(lán)牙模塊作為現(xiàn)代無線通信的重要組成部分,在智能家居、可穿戴設(shè)備、健康監(jiān)測等多個領(lǐng)域得到了廣泛應(yīng)用。然而,隨著藍(lán)牙技術(shù)的普及,其安全性和隱私保護(hù)問題也日益凸顯。本文將探討藍(lán)牙模塊在數(shù)
    的頭像 發(fā)表于 06-14 16:06 ?473次閱讀

    E-Val Pro Plus有線驗證解決方案,功能升級,優(yōu)化制藥流程,確保安全性和合規(guī)!

    有線驗證解決方案全新升級,虹科E-Val Pro Plus新品發(fā)布!幫助您減少停機(jī)和上市時間,優(yōu)化制藥流程,確保合規(guī)安全性,是任何熱驗證過程的理想解決方案!
    的頭像 發(fā)表于 04-18 13:36 ?297次閱讀
    E-Val Pro Plus有線驗證解決方案,功能<b class='flag-5'>升級</b>,優(yōu)化制藥流程,確保<b class='flag-5'>安全性</b>和合規(guī)<b class='flag-5'>性</b>!

    Rust效率領(lǐng)先C++兩倍,內(nèi)存安全成國家安全議題

    這項發(fā)現(xiàn)由谷歌安卓平臺工具及庫的工程總監(jiān)Lars Bergstrom在日前召開的Rust Nation英國峰會揭示。盡管此前業(yè)內(nèi)對Rust的安全性和穩(wěn)定性存在一定爭議,特別是其‘unsafe’關(guān)鍵字的存在令人擔(dān)憂。
    的頭像 發(fā)表于 04-01 15:37 ?835次閱讀

    NanoEdge AI的技術(shù)原理、應(yīng)用場景及優(yōu)勢

    能耗并提高數(shù)據(jù)安全性。本文將對 NanoEdge AI 的技術(shù)原理、應(yīng)用場景以及優(yōu)勢進(jìn)行綜述。 1、技術(shù)原理 NanoEdge AI 的核心技術(shù)包括邊緣計算、神經(jīng)網(wǎng)絡(luò)壓縮和低功耗硬件設(shè)計。邊緣計算
    發(fā)表于 03-12 08:09

    為工業(yè)應(yīng)用選擇高安全性功率繼電器

    為工業(yè)應(yīng)用選擇高安全性功率繼電器
    的頭像 發(fā)表于 12-05 15:11 ?418次閱讀
    為工業(yè)應(yīng)用選擇高<b class='flag-5'>安全性</b>功率繼電器