2022年,是中國人追逐群星的里程碑之年。
今年10月31日,中國天宮空間站的第二個(gè)科學(xué)實(shí)驗(yàn)?zāi)K——夢(mèng)天實(shí)驗(yàn)艙,搭載長征五號(hào)B遙四運(yùn)載火箭發(fā)射升空。隨著之后天實(shí)驗(yàn)艙成功與之前發(fā)射的天和核心艙完成精準(zhǔn)對(duì)接,中國空間站歷史性地完成了“合體”。至此,中國空間站距離建成僅剩一步之遙。
從天舟四號(hào)到天舟五號(hào),從問天艙到夢(mèng)天艙,從神舟十四號(hào)到神舟十五號(hào),取得一系列航天成果的2022,同時(shí)也是中國載人航天工程立項(xiàng)實(shí)施30周年。三十年奮進(jìn)勃發(fā),讓中國人史無前例地接近星辰,接近宇宙中的無限可能。
而在科技賽場的另一條關(guān)鍵跑道上,2022同樣至關(guān)重要。近日,新華社與百度文心一格聯(lián)合推出了一支AIGC視頻——《AI描繪天宮盛宴》。這支視頻畫面全部由AI自動(dòng)生成,用充滿中國韻味的筆觸,回顧了中國載人航天的三十年輝煌歷程。眾多網(wǎng)友感嘆,AI生成內(nèi)容竟然在極短時(shí)間內(nèi)就達(dá)成了這種效果,實(shí)在難以想象。
2022年,被業(yè)界稱為AIGC元年。伴隨著AI作畫大規(guī)模商業(yè)化落地,這一能力開始為全球用戶所接受。AIGC的飽含巨大商業(yè)價(jià)值的下一站,就是AI生成內(nèi)容。而在AIGC的“宇宙探索”中,中國人同樣不落人后。以百度文心大模型為代表的中國力量,正在帶領(lǐng)全球AI產(chǎn)業(yè)接近AIGC的無限可能。
2022年,文心大模型在AI生成內(nèi)容這條賽道上不停探索,給出了一系列讓人眼前一亮的成績。在其背后,既可以看到大模型在AI作畫領(lǐng)域的技術(shù)趨于完備,又可以看到中文、中國文化背景下的AIGC全面發(fā)展。面向AIGC的群星,文心大模型已經(jīng)成為中國AI產(chǎn)業(yè)的一座“空間站”。探索AIGC更多可能,文心大模型的成績單
在全球經(jīng)濟(jì)普遍遇冷的2022,AI技術(shù)卻是一片繁榮。從AI作畫到AI對(duì)話,各種AI技術(shù)創(chuàng)新在全球范圍內(nèi)火爆出圈。而所有AI能力中最讓人看好其商業(yè)前景的,則是AIGC的下一站——AI生成內(nèi)容。
我們處在一個(gè)被短視頻顛覆和重構(gòu)的時(shí)代。短視頻平臺(tái)已經(jīng)在全球范圍內(nèi)形成了用戶最多、影響力大的媒介形式。AI與視頻的結(jié)合,正變成新的巨型風(fēng)口。在2022年,百度文心大模型先后帶來了一系列視頻生成作品,其完善的效果與創(chuàng)意性地表達(dá),贏得了業(yè)界與公眾的一致認(rèn)可。
在百度2022萬象大會(huì)期間,數(shù)字人度曉曉作詞作曲演唱的MV《啟航星》正式上線。這也成為成為首支全AIGC生成的音樂MV?!秵⒑叫恰稭V視頻依托百度推出的AI藝術(shù)和創(chuàng)意輔助平臺(tái)——文心一格,根據(jù)歌詞自動(dòng)生成畫面。其不僅探索了數(shù)字人、AI生成內(nèi)容等技術(shù)的邊界,更為MV制作、AI與音樂產(chǎn)業(yè)結(jié)合展現(xiàn)出了清晰的路徑。
10月20日,《人民日?qǐng)?bào)》發(fā)布AI根據(jù)二十大報(bào)告中部分詞語描繪的未來中國圖景視頻,該視頻由百度飛槳、文心一格提供技術(shù)支持。根據(jù)內(nèi)容描述,文心大模型準(zhǔn)確描繪出了未來中國的發(fā)展圖卷。筆觸老練自然,完全沒有傳統(tǒng)意義上認(rèn)為AIGC內(nèi)容會(huì)有的生澀感與不和諧。
等到《AI描繪天宮盛宴》到來,我們可以看到文心大模型生成的視頻內(nèi)容更加具有整體性風(fēng)格,畫面調(diào)動(dòng)也更有邏輯性,并且內(nèi)容能夠與中國傳統(tǒng)文化,比如《西游記》中蟠桃盛宴,進(jìn)行有機(jī)且巧妙的結(jié)合。
在這一哥哥AI生成內(nèi)容背后,我們可以看到文心大模型走出了兩條路:技術(shù)之路,與文化之路。
AI生成內(nèi)容的技術(shù)難點(diǎn),正被一個(gè)個(gè)打破
“最先進(jìn)的 AI 動(dòng)畫生成技術(shù)在中國?!?/p>
這句話,是今年8月文心ERNIE-ViLG 2.0模型通過百度API服務(wù)的方式進(jìn)行開放公測后,一位外國開發(fā)者留在評(píng)論區(qū)的。幾個(gè)月之后,這樣的肯定依舊令我們振奮。數(shù)年前,絕大部分人可能會(huì)覺得中國難以在AI生成內(nèi)容中實(shí)現(xiàn)領(lǐng)先,但現(xiàn)在這一切已經(jīng)做到了。
究其根本,在于文心大模型持續(xù)面向AIGC的技術(shù)挑戰(zhàn)發(fā)起一波波沖鋒。今年在文心大模型支持的多部破圈視頻里,我們可以看到其中的技術(shù)力表現(xiàn)持續(xù)升級(jí)。簡單感、不流暢、缺乏創(chuàng)意風(fēng)格等AI生成內(nèi)容的傳統(tǒng)問題,正在一個(gè)個(gè)被文心打破。
在這背后,是文心大模型ERNIE-ViLG 2.0跨模態(tài)圖文生成能力的幫助和支持?;贓RNIE-ViLG 2.0,可以實(shí)現(xiàn)從文本內(nèi)容到視頻內(nèi)容中,轉(zhuǎn)化的可控性與細(xì)節(jié)描述能力不斷提升。而這源于秉承著百度在文心大模型當(dāng)中探索的知識(shí)增強(qiáng)方向,為ERNIE-ViLG 2.0找到了核心的升級(jí)方向。ERNIE-ViLG 2.0采用基于知識(shí)增強(qiáng)算法的混合降噪專家建模,是全球首個(gè)將知識(shí)增強(qiáng)與AIGC相互結(jié)合的大模型。其最終表現(xiàn),在權(quán)威評(píng)測集 MS-COCO 和人工盲評(píng)上均超越了 Stable Diffusion、DALL-E 2等主流模型,在AI生成內(nèi)容等方面,取得全球業(yè)界的最佳效果,在語義可控性、圖像清晰度等方面均展現(xiàn)出了顯著優(yōu)勢(shì)。
從《AI描繪天宮盛宴》中,我們可以看到畫面可控性、復(fù)雜構(gòu)圖和細(xì)節(jié)刻畫能力都達(dá)到了新的水平高度。AI生成內(nèi)容不再是生成一幀幀圖片合成視頻,而是基于統(tǒng)一風(fēng)格,完整、連續(xù)地展現(xiàn)出了視頻全貌。這就是知識(shí)增強(qiáng)路徑為AIGC帶來的不同之處。
當(dāng)時(shí)間來到2023,中國AI行業(yè)、AI開發(fā)者,以及廣大視頻創(chuàng)作者,將得到全球領(lǐng)先的AI生成內(nèi)容能力作為發(fā)展引擎——這就是文心大模型,這座“空間站”的戰(zhàn)略意義。
更懂中國,更懂未來
另一方面,我們可以在《AI描繪天宮盛宴》看到一種我們非常熟悉的審美風(fēng)格,其神韻非常類似1961年上海美術(shù)電影制片廠制作的《大鬧天宮》。那既是中國動(dòng)畫史的開端,也是深刻國民DNA的文化記憶。
用這種審美意蘊(yùn)展現(xiàn)中國航天三十年的故事,是非常容易獲得國人共鳴,產(chǎn)生審美與文化認(rèn)同的。這一點(diǎn)其實(shí)非常重要,AIGC的最終價(jià)值在于文化傳播。試想一下,如果AI生成的內(nèi)容不懂一個(gè)國家的語言、文化、典故以及審美意味,那么最終做出來的內(nèi)容是否可能實(shí)現(xiàn)高效率、有認(rèn)同的傳播?
從這個(gè)角度看,中國的AI大模型發(fā)展與AIGC能力建設(shè)就顯得更加富有不可替代性。我們不能等到AI生成內(nèi)容大規(guī)模落地時(shí),一味照搬符合他國文化與英語語言習(xí)慣的內(nèi)容給中國觀眾看。而文心對(duì)中文數(shù)據(jù)、中文知識(shí)的學(xué)習(xí),以及對(duì)中國文化、中國審美的理解,則適當(dāng)?shù)靥钛a(bǔ)了這個(gè)空白。從文心一格對(duì)中文的理解能力,以及最終生成內(nèi)容中展現(xiàn)的中國意境,就可以看到目前適合中國環(huán)境的AIGC。我們不需要在基礎(chǔ)能力和技術(shù)上進(jìn)行漫長的模仿與追趕,而是可以站在更高點(diǎn),直視AIGC最前沿、最令人激動(dòng)的可能性。
2022年,是中國人追逐群星之年,也是中國人追逐AIGC之夢(mèng)的一年。伴隨著更多AI生成內(nèi)容火爆出全,更多AIGC的行業(yè)化方案落地,更多平臺(tái)化能力開放,文心一格正在打開科技與文化融合創(chuàng)新的想象空間,文心大模型正在成為AIGC發(fā)展的新引擎。
在文心這座“空間站”,我們已能看到智能世界的浩瀚星空。
審核編輯黃昊宇
-
AI
+關(guān)注
關(guān)注
87文章
29817瀏覽量
268111 -
AIGC
+關(guān)注
關(guān)注
1文章
352瀏覽量
1485
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論