電子發(fā)燒友網(wǎng)報道(文/李彎彎)近日,在中國澳門開幕的第三屆BEYOND國際科技創(chuàng)新博覽會(簡稱“BEYONDExpo”)上,阿里文娛數(shù)字人厘里(Leah)亮相。
阿里巴巴集團聯(lián)合創(chuàng)始人兼董事會執(zhí)行副主席、NBA布魯克林籃網(wǎng)隊、WNBA紐約自由人隊擁有者蔡崇信介紹,通過AIGC技術(shù),只要一周的時間就可以打造一個數(shù)字虛擬偶像,而所呈現(xiàn)的效果已經(jīng)可以取代人類。
AIGC技術(shù)提升虛擬偶像完成效率
厘里是阿里文娛旗下首個數(shù)字人偶像,出道不久就已經(jīng)通過代言、直播、數(shù)字藏品等多種形式,與英特爾、MLB、三星、奈飛等多個國際品牌合作,協(xié)助品牌與年輕潮流用戶建立更加緊密的連接。目前在微博平臺,數(shù)字人厘里Leah已有超82萬粉絲關注。
在BEYONDExpo博覽會現(xiàn)場,蔡崇信表示,AIGC技術(shù)的發(fā)展使得完成虛擬偶像的效率大大提高,他認為,NBA球隊可能會借用數(shù)字女演員厘里來做宣傳。未來,數(shù)字人在電影、劇集、動畫及綜藝方面或?qū)眍嵏残员憩F(xiàn)。
AIGC,全名“AI generated content”,又稱生成式AI,是指通過人工智能技術(shù)生成的各種文本、圖像、音頻和視頻等多媒體內(nèi)容。其技術(shù)原理是基于自然語言處理和機器學習算法,基本流程是通過輸入大量的語料庫和模型訓練,讓機器學習模型學習自然語言的規(guī)則和模式,并且根據(jù)任務的不同選擇不同的模型來生成相應的內(nèi)容。
事實上,AIGC技術(shù)的發(fā)展可以追溯到上世紀50年代,當時計算機科學家就開始嘗試使用計算機生成語言模型。最近幾年,深度學習技術(shù)極大地推動了AI生成內(nèi)容技術(shù)的發(fā)展,特別是基于神經(jīng)網(wǎng)絡的自然語言處理技術(shù)。其中最著名的是OpenAI的語言生成模型GPT系列。
虛擬數(shù)字人是一種基于人工智能和圖形計算技術(shù)的數(shù)字化形象,可以根據(jù)用戶的需求和喜好,生成具有獨特外貌、聲音、性格和表情的虛擬角色。雖然數(shù)字人已經(jīng)誕生很長世間,不過長期以來大部分數(shù)字人被吐槽過于呆板,表情、姿勢僵硬,缺乏實時互動能力。
然而業(yè)界普遍認為,AIGC技術(shù)的進步將為數(shù)字人提供強大的支撐,能夠提升數(shù)字人的生動力,使其能夠適應不同的場景和需求。
AIGC技術(shù)如何賦能數(shù)字人
AIGC的助力主要體現(xiàn)在畫面和聲音層面:AIGC在音視頻生成領域建樹多,一方面,從語音模仿到變聲器等功能,大大增加了互動娛樂性;另一方面,定制化的AIGC工具可以方便創(chuàng)作者制作出畫面、聲音、動態(tài)效果更精確的產(chǎn)品,提升作品綜合質(zhì)量,極大地提高創(chuàng)作效率。
《2022虛擬數(shù)字人綜合評估指數(shù)報告》將虛擬數(shù)字人發(fā)展總結(jié)為三個階段:第一階段是擬人化,由計算機虛擬合成的高度逼真的三維動畫人物,動作形態(tài)聲音等與真人吻合,初步基于AI實現(xiàn)虛擬人驅(qū)動,實時進行信息溝通和反饋;第二階段是同人化,從外觀的形態(tài)模擬進階到情感的可交互,情感算法技術(shù)實現(xiàn)與人類高質(zhì)量情感互動;第三階段是超人化,虛擬人的能力超越自然人,虛擬實體化,機器人承載虛擬人意識回到現(xiàn)實世界。
在ChatGPT和AGC技術(shù)的加持下,虛擬人將進入“同人化”階段,通過與各行業(yè)應用場不斷地深度融合,虛擬人將變身為企業(yè)的數(shù)字員工,成為企業(yè)降本增效的重要幫手,依靠系統(tǒng)的企業(yè)知識庫,為用戶提供72小時的隨時服務,協(xié)助企業(yè)完成重復性工作,并大幅提高基礎工作的效率和服務質(zhì)量。
生動具體的虛擬形象,加以靈動且人性化的情感交互能力,這是一次運營工具的數(shù)字化革命,在不遠的未來,一個低成本高效率的數(shù)字員工將成為企業(yè)的標配。
創(chuàng)想數(shù)維CEO吳未此前在接受媒體采訪的時候表示,數(shù)字人制作流程一般包括設計、建模制作、驅(qū)動和運營環(huán)節(jié)。在這個流程中,可以應用大量的人工智能算法和模型,來加快速度。同時,生成式AI也能使數(shù)字人的響應更加智能化,更符合人類特性。
舉例來說,以前數(shù)字人驅(qū)動一般需要構(gòu)建知識圖譜,然后將其制作成語音庫和動作庫,只能回答知識圖譜范圍內(nèi)的問題。但有了大語言模型,只需要組合其他組件,如文字轉(zhuǎn)語音、語音轉(zhuǎn)動作、表情庫和動作庫,就能生成一個可以響應任何問題的智能化AI驅(qū)動程序。也就是說,可以像搭樂高積木一樣,將各種人工智能組件拼接起來,以更低的成本獲得更好的數(shù)字人驅(qū)動效果。
小結(jié)
可以看到,AIGC技術(shù)的進步逐漸在數(shù)字人領域得到應用。就如蔡崇信所言,通過AIGC技術(shù),只要一周的時間就可以打造一個數(shù)字虛擬偶像??偨Y(jié)來看就是,AIGC技術(shù)讓數(shù)字人的制作更簡單、更快,它也從聲音、畫面、情感等多個角度,讓數(shù)字人更生動,更像人。
-
阿里
+關注
關注
6文章
433瀏覽量
32792 -
AIGC
+關注
關注
1文章
352瀏覽量
1485
發(fā)布評論請先 登錄
相關推薦
評論