0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI為表情包生成搞笑文字說(shuō)明

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:未知 ? 作者:胡薇 ? 2018-07-31 17:38 ? 次閱讀

制作表情包還能獲得研究生學(xué)分?如果使用深度學(xué)習(xí)技術(shù)來(lái)實(shí)現(xiàn)的話,是有可能的。

23歲的Lawrence Peirson正在攻讀斯坦福大學(xué)的理論天體物理學(xué)博士學(xué)位,但今年卻決定進(jìn)修幾門(mén)AI課程。在一個(gè)班級(jí)項(xiàng)目中,他和自己的同班同學(xué)E.Meltem Tolunay開(kāi)發(fā)了一個(gè)神經(jīng)網(wǎng)絡(luò),可為表情包生成說(shuō)明文字。他們發(fā)布了一份關(guān)于該網(wǎng)絡(luò)的白皮書(shū),其標(biāo)題十分貼切:“Dank Learning”(“Dank”是“Cool”的同義詞)。

雖然現(xiàn)在已經(jīng)存在很多訓(xùn)練深度學(xué)習(xí)模型為圖片生成文字說(shuō)明的例子。例如,準(zhǔn)確地為一張圖片生成說(shuō)明性文字“踏著沖浪板的男人”或“拿著蛋卷冰淇淋的孩子”。但對(duì)于表情包,Peirson想挑戰(zhàn)一下神經(jīng)網(wǎng)絡(luò)能否突破字面解釋,創(chuàng)造出具有幽默感的文字說(shuō)明。

盡管一開(kāi)始Peirson對(duì)所生成表情包的趣味性持懷疑態(tài)度,但最終他發(fā)現(xiàn)深度學(xué)習(xí)模型確實(shí)可以生成“一些非常有趣的原創(chuàng)幽默內(nèi)容”。

獲得“深度表情包”

該神經(jīng)網(wǎng)絡(luò)為一類流行的動(dòng)物表情包生成說(shuō)明文字。為了收集用于訓(xùn)練該深度學(xué)習(xí)模型所需的數(shù)據(jù),Peirson從memegenerator.net網(wǎng)站上搜集了大約40萬(wàn)個(gè)由用戶生成的表情包。該網(wǎng)站提供各類表情包模板,并允許用戶自己搭配文字說(shuō)明。

該數(shù)據(jù)集包含大約3000個(gè)基本圖像,每個(gè)圖像都配有多種不同的文字說(shuō)明。由于輸入數(shù)據(jù)均來(lái)自用戶,深度學(xué)習(xí)模型所處理的表情包文字說(shuō)明的質(zhì)量良莠不齊。

“我們使用了40萬(wàn)個(gè)表情包,其中的大部分沒(méi)有那么有趣,但是至少它們能夠教會(huì)系統(tǒng)表情包是什么,以及什么樣的笑話才是與圖片內(nèi)容相關(guān)的,”他說(shuō)道。

互聯(lián)網(wǎng)表情包在網(wǎng)絡(luò)上早已流傳多年,Reddit、Facebook、9GAG和Quick Meme等網(wǎng)站是它們的大本營(yíng)。最火爆的表情包可能會(huì)配有超過(guò)200萬(wàn)種原創(chuàng)文字說(shuō)明。

表情包引用的通常是流行文化、時(shí)事或某個(gè)特定的互聯(lián)網(wǎng)亞文化群體才明白的“梗”。(Peirson創(chuàng)建了一個(gè)名為“The specific heat capacity of europium at standard temperature and pressure”的表情包頁(yè)面。)

這些表情包同時(shí)汲取了數(shù)字文化的精華與糟粕。其論文指出,訓(xùn)練數(shù)據(jù)中大多是關(guān)于咒罵、種族主義和性別歧視的表情包。Peirson覺(jué)得需要在未來(lái)訓(xùn)練中過(guò)濾掉這些內(nèi)容,但他指出這一問(wèn)題并不是表情包所獨(dú)有的,“這在自然語(yǔ)言處理中是一個(gè)普遍存在的大問(wèn)題”。

該深度學(xué)習(xí)模型利用CUDA語(yǔ)言編寫(xiě),使用了一塊NVIDIA GPU。Peirson和Tolunay同時(shí)嘗試了使用無(wú)標(biāo)記的數(shù)據(jù)和標(biāo)有表情包標(biāo)題的數(shù)據(jù)(例如,成功小子或暴走漫畫(huà)),但并沒(méi)有發(fā)現(xiàn)表情包的質(zhì)量有任何顯著差異。

“這些表情包非常有趣,不過(guò)是‘也還說(shuō)得過(guò)去,但其實(shí)并不是那么搞笑’這種程度,” Peirson說(shuō)道,“表情包就是借用了這種幽默感。

該神經(jīng)網(wǎng)絡(luò)為此類動(dòng)物表情包生成了說(shuō)明文字。

讓表情包變酷可不容易

為了評(píng)估深度學(xué)習(xí)模型成功與否,兩人開(kāi)發(fā)了一個(gè)“困惑指數(shù)”(perplexity score),用其檢查神經(jīng)網(wǎng)絡(luò)是否可以明確識(shí)別出數(shù)據(jù)的模式。他們針對(duì)幾百?gòu)垘в蓄A(yù)設(shè)格式的表情包計(jì)算出了“困惑指數(shù)”。如Boromir(電影《魔戒》中的角色)表情包,該表情包的文字說(shuō)明始終都帶有“one does not simply”的字樣。

但對(duì)于表情包的真正考驗(yàn)在于其是否搞笑。

在一項(xiàng)定性調(diào)查中,Peirson與其白皮書(shū)的共同作者同時(shí)向受訪者展示了人類創(chuàng)作的表情包和深度學(xué)習(xí)模型生成的表情包。他們向受訪者提出了兩個(gè)問(wèn)題:“表情包是由人類創(chuàng)作的還是由計(jì)算機(jī)創(chuàng)作的?”,以及“如何評(píng)價(jià)表情包的幽默程度?”。

Peirson表示,訪問(wèn)結(jié)果顯示深度學(xué)習(xí)模型創(chuàng)作的表情包“與人類創(chuàng)作的表情包幾乎無(wú)法區(qū)分”。

他們還研究了其神經(jīng)網(wǎng)絡(luò)如何為訓(xùn)練數(shù)據(jù)集之外的表情包生成文字說(shuō)明。在這種情況下,算法會(huì)基于其在訓(xùn)練數(shù)據(jù)中看到的內(nèi)容推理未知圖像的模式。為了測(cè)試這一點(diǎn),Peirson甚至向深度學(xué)習(xí)系統(tǒng)展示了他自己的照片,生成的文字也相當(dāng)有趣。

Peirson在深度學(xué)習(xí)模型中輸入了自己的照片,模型生成了這張表情圖。

表情包通常會(huì)進(jìn)行病毒式傳播,并成為“網(wǎng)紅”,而以表情包為主題的白皮書(shū)也受到了歡迎。當(dāng)該項(xiàng)目獲得媒體報(bào)道并受到關(guān)注時(shí),Peirson表示自己“倍感震驚”。一款名為Dank Learning的移動(dòng)應(yīng)用也即將登陸App Store。

他說(shuō),這個(gè)項(xiàng)目讓他打開(kāi)了新的視角:原來(lái)表情包的影響力如此巨大。每天,全球有數(shù)百萬(wàn)用戶在社交媒體網(wǎng)站上傳播表情包。

在Peirson看來(lái),強(qiáng)大的AI有潛力根據(jù)時(shí)事“突發(fā)奇想”,生成表情包,從而影響公眾認(rèn)知。而廣告主也可以使用表情包提升品牌知名度:“讓表情包進(jìn)行病毒式傳播是一種絕妙的營(yíng)銷方式。”

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28875

    瀏覽量

    266199
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5422

    瀏覽量

    120587

原文標(biāo)題:表情包生產(chǎn)基地:AI像人類一樣為圖像生成搞笑文字說(shuō)明

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    三行代碼完成生成AI部署

    OpenVINO2024.2版本跟之前版本最大的不同是OpenVINO2024.2分兩個(gè)安裝分別是基礎(chǔ)生成AI支持
    的頭像 發(fā)表于 08-30 16:49 ?228次閱讀
    三行代碼完成<b class='flag-5'>生成</b>式<b class='flag-5'>AI</b>部署

    Freepik攜手Magnific AI推出AI圖像生成

    。Freepik Mystic自詡目前市場(chǎng)上最先進(jìn)的AI圖像生成器,其獨(dú)特之處在于能夠直接生成全高清圖像,這在業(yè)界尚屬首例。
    的頭像 發(fā)表于 08-30 16:23 ?947次閱讀

    STAR AI進(jìn)軍美股科技星智能領(lǐng)跑生成AI賽道

    自ChatGPT問(wèn)世以來(lái),從文字chatbot到視頻生成和機(jī)器人,生成式人工智能(Generative AI)的商業(yè)應(yīng)用已經(jīng)成為全球最具爆炸性效應(yīng)的賽道,
    的頭像 發(fā)表于 08-22 08:56 ?178次閱讀
    STAR <b class='flag-5'>AI</b>進(jìn)軍美股科技星智能領(lǐng)跑<b class='flag-5'>生成</b>式<b class='flag-5'>AI</b>賽道

    NVIDIA攜手Meta推出AI服務(wù),企業(yè)提供生成AI服務(wù)

    NVIDIA近日宣布了一項(xiàng)重大舉措,正式推出NVIDIA AI Foundry服務(wù)與NVIDIA NIM(NVIDIA Inference Microservices)推理微服務(wù),這兩項(xiàng)創(chuàng)新成果與同步問(wèn)世的Llama 3.1系列開(kāi)源模型強(qiáng)強(qiáng)聯(lián)合,全球企業(yè)構(gòu)建強(qiáng)大的
    的頭像 發(fā)表于 07-25 16:57 ?389次閱讀

    NVIDIA AI Foundry 全球企業(yè)打造自定義 Llama 3.1 生成AI 模型

    Foundry 提供從數(shù)據(jù)策管、合成數(shù)據(jù)生成、微調(diào)、檢索、防護(hù)到評(píng)估的全方位生成AI 模型服務(wù),以便部署自定義 Llama 3.1 NVIDIA NIM 微服務(wù)和新的 NVIDIA NeMo
    發(fā)表于 07-24 09:39 ?622次閱讀
    NVIDIA <b class='flag-5'>AI</b> Foundry <b class='flag-5'>為</b>全球企業(yè)打造自定義 Llama 3.1 <b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> 模型

    bootloader在線生成的壓縮內(nèi)空文件夾怎么解決?

    在線生成bootloader,同樣的Bootloader配置,成功生成過(guò)一次,再次生成之后文件夾內(nèi)空,壓縮172B,試了很多次都一樣
    發(fā)表于 07-18 07:32

    曠視AI開(kāi)源新突破:上傳照片即可生成表情視頻!

    為了展示其泛化性,MegActor甚至可以將VASA中的人物肖像和視頻組合生成,得到生動(dòng)的表情視頻。即使與阿里EMO的官方案例相比,MegActor也能生成近似的效果。
    的頭像 發(fā)表于 07-12 11:20 ?235次閱讀
    曠視<b class='flag-5'>AI</b>開(kāi)源新突破:上傳照片即可<b class='flag-5'>生成</b><b class='flag-5'>表情</b><b class='flag-5'>包</b>視頻!

    原來(lái)這才是【生成AI】!!

    隨著ChatGPT、文心一言等AI產(chǎn)品的火爆,生成AI已經(jīng)成為了大家茶余飯后熱議的話題??墒?,為什么要在AI前面加上“生成式”這三個(gè)字呢?
    的頭像 發(fā)表于 06-05 08:04 ?290次閱讀
    原來(lái)這才是【<b class='flag-5'>生成</b>式<b class='flag-5'>AI</b>】?。? />    </a>
</div>                            <div   id=

    阿里云視頻生成技術(shù)創(chuàng)新!視頻生成使用了哪些AI技術(shù)和算法

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)日前,阿里云宣布通義實(shí)驗(yàn)室研發(fā)的視頻生成模型EMO正式上線通義App,免費(fèi)對(duì)所有人開(kāi)放。借助這一功能,用戶可以在歌曲、熱梗、表情中任選一款模板,然后通過(guò)上傳一張肖像
    的頭像 發(fā)表于 05-08 00:07 ?3181次閱讀

    京東推出AI全能服務(wù)

    京東近日在“春曉計(jì)劃”中隆重推出了全新的“AI全能服務(wù)”,旨在通過(guò)一系列先進(jìn)的AI工具,幫助商家輕松生成圖文、視頻和直播內(nèi)容,進(jìn)而實(shí)現(xiàn)運(yùn)營(yíng)成本的大幅降低,據(jù)稱可節(jié)省高達(dá)50%的運(yùn)營(yíng)成
    的頭像 發(fā)表于 03-14 11:48 ?626次閱讀

    第一撥靠Sora賺錢的人已經(jīng)出現(xiàn)

    隨著OpenAI最新發(fā)布的人工智能文生視頻大模型Sora的問(wèn)世,科技與創(chuàng)意產(chǎn)業(yè)再掀熱潮。據(jù)悉,Sora不僅能根據(jù)文字說(shuō)明創(chuàng)造出逼真且富有想象力的場(chǎng)景,更因其強(qiáng)大的生成能力引發(fā)了市場(chǎng)與消費(fèi)者的極大興趣。
    的頭像 發(fā)表于 02-22 14:05 ?596次閱讀

    RZ/V2L DRP-AI支持版本.7.41發(fā)布說(shuō)明

    電子發(fā)燒友網(wǎng)站提供《RZ/V2L DRP-AI支持版本.7.41發(fā)布說(shuō)明.pdf》資料免費(fèi)下載
    發(fā)表于 02-01 10:07 ?0次下載
    RZ/V2L DRP-<b class='flag-5'>AI</b>支持<b class='flag-5'>包</b>版本.7.41發(fā)布<b class='flag-5'>說(shuō)明</b>

    因?yàn)?b class='flag-5'>生成式AI興起《紐約時(shí)報(bào)》起訴OpenAI和微軟

    《紐約時(shí)報(bào)》把這個(gè)難題拋給了美國(guó)紐約南區(qū)的美國(guó)聯(lián)邦法院。 因?yàn)榇饲啊都~約時(shí)報(bào)》與微軟和OpenAI的談判沒(méi)有達(dá)成任何有效的解決方案?!都~約時(shí)報(bào)》在美國(guó)紐約南區(qū)的美國(guó)聯(lián)邦法院起訴OpenAI和微軟,指控他們的生成AI侵犯了其文字
    的頭像 發(fā)表于 12-28 17:08 ?607次閱讀

    生成AI技術(shù)的應(yīng)用前景

    生成AI(人工智能)與我們熟知的 AI 有何不同?這篇文章將為我們一探究竟!
    的頭像 發(fā)表于 11-29 12:20 ?1123次閱讀

    利用 NVIDIA Jetson 實(shí)現(xiàn)生成AI

    近日,NVIDIA 發(fā)布了 Jetson 生成AI 實(shí)驗(yàn)室(Jetson Generative AI Lab),使開(kāi)發(fā)者能夠通過(guò) NVIDIA Jetson 邊緣設(shè)備在現(xiàn)實(shí)世界中探索生成
    的頭像 發(fā)表于 11-07 21:25 ?771次閱讀
    利用 NVIDIA Jetson 實(shí)現(xiàn)<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b>