麻豆视频传媒入口,日韩欧美国产第二区

8月23日，“2018年全球高校學生DeeCamp AI訓練營”在北大舉行閉幕式，經(jīng)過層層評比，來自全球高校的300學生組成的28支隊伍選出了8支優(yōu)勝隊伍。其中，一只用AI自動生成嘻哈歌詞的隊伍獲得了“最佳DEMO獎”。

AI寫嘻哈歌詞的水平如何？能達到以假亂真的地步嗎？不看廣告看療效，我們先來猜猜下面的歌詞哪些是AI寫的：

不是樂理專修做點兒曲式研究我們的力量來自宇宙自己的節(jié)奏不是樂理專修所有聽的觀眾打破他們傳統(tǒng) 進到環(huán)球繼續(xù)讓你感受

再來一個：

自己就帶上了有色眼鏡金錢摧毀多少事情瓦解你的中樞神經(jīng)自己就帶上了有色眼鏡我只想把世界分的更清卻發(fā)現(xiàn)自己卻模糊了心

正確答案是：第一行都是模型生成的，第二行是原作?？梢钥闯?，AI的效果還是不錯的，至少挺押韻的。

那么，這個有嘻哈精神的團隊到底是怎樣搭建這個 AI 模型的？

首先我們需要定義這個問題，也就是根據(jù)一句歌詞迭代生成一段嘻哈歌詞。另外一個是押韻，這是嘻哈歌詞一大特點。

清楚了問題，我們?nèi)フ{(diào)研一下已經(jīng)有的文本聲稱方案，最終把它的優(yōu)點和缺點列出來，然后我們選擇了SequenceGAN作為基礎模型，并且在這個之上提出我們的模型——SequenceGAN。

SequenceGAN 有兩個組件，生成器、判讀器，讓生成器生成足以逼真的歌詞。

我們在這個基礎之上，有一個嘻哈生成網(wǎng)絡。第一點是在這個之前我們增加了一個編碼網(wǎng)絡，將然后生成一些跟主題相關的歌詞，第二點是把目標函數(shù)修改。

以下是SequenceGAN的效果，它有非常多的重復的語句，這就是GAN的一個通病，對于不同的輸入，輸出卻很相同。

我們知道嘻哈歌手不可能一句話唱一整首，所以我們調(diào)研了一些文獻，并且借鑒今年SentiGAN的想法，對生成器的目標函數(shù)進行修改，最后效果非常顯著，有一個質的變化。

有了多樣化的文本之后，我們下一步要解決的問題就是如何去實現(xiàn)押韻。我們嘗試兩種方案，一種是基于目標函數(shù)，增加押韻場景項，就好像考試的附加題，做對了給額外得分。但是我們希望它一直能夠去做附加題，實現(xiàn)押韻的功能。但是它并不能很自主地學習到押韻的關。

最后我們嘗試了基于規(guī)則的方式來實現(xiàn)這個押韻。比如輸入“你真美麗”，我們根據(jù)這個i的韻腳去構建一個向量，做一個簡單的操作，就能夠得到必然是押韻的結果，同時可以控制押韻的概率。

▌附完整解讀

項目作者：孫蒙新（廈門大學）、項瑞昌（華中科技大學）、伊瑋雯（北京郵電大學）、陸亦揚（合肥工業(yè)大學）、石華（西南石油大學）、汪自力（西安電子科技大學）、龐雲(yún)升（重慶大學）、周子群（東北大學）、王超群（北京林業(yè)大學）、詹玨岑（VanderniltUniversity）

1、數(shù)據(jù)

我們一共使用了 10w 條嘻哈歌詞，并且已經(jīng)將一些不符合社會主義核心價值觀的句子標注了出來。數(shù)據(jù)的預處理主要步驟如下：

在對句子進行篩選之后，我們利用 Jieba 進行分詞，觀察到單句長度集中在 8~10 左右；

在利用 Tensorflow 中的 Tokenizer 進行 tokenize 并構建 word2idex 字典后，詞表大小在 11000 左右，考慮到這個大小還可以接受，沒有做限制詞表大小的操作；

利用 pad_sequence 將句子 padding 到 20（和 SeqGAN 中相同）；

構建 x-y pair，利用上一句預測下一句（導師后來建議可以借鑒用 Skip-gram 的思路，同時預測上一句和下一句，但沒有時間去嘗試了），分割數(shù)據(jù)集。

訓練數(shù)據(jù)地址：

https://drive.google.com/drive/folders/1QrO0JAti3A3vlZlUemouOW7jC3K5dFZr）

2、模型

我們的生成模型的整體基于 SeqGAN，并對其做了一些修改，模型架構如下：

主要改動有兩點：

1.增加輸入語句的編碼：這一點類似 Seq2Seq 的 Encoder，SeqGAN 原本的 initial state 是全 0 的，為了將上文的信息傳遞給生成器，我們采用了一個簡單的全連接層（Fully Connected Layer），將輸入句子的 Word Embedding 經(jīng)過一個線性變化之后作為生成器的 LSTM。事實上也可以嘗試使用 RNN（LSTM）來作為 Encoder，不過這樣模型的速度可能會比較慢。

2.將原先 Generator 的 Loss Function 改為 Penalty-based Objective：在訓練模型的過程中我們發(fā)現(xiàn)，模型在 Adversarial Training 多輪之后出現(xiàn)了嚴重的 mode collapse 問題，比如：

別質疑自己遮罩錯的消息不要過得消極世間人都笑我太瘋癲世間人都笑我太瘋癲守護地獄每座墳墓世間人都笑我太瘋癲你不知道rapper付出多少才配紙醉金迷世間人都笑我太瘋癲但卻從來沒有心狠過如果你再想聽你不知道rapper付出多少才配紙醉金迷你不知道rapper付出多少才配紙醉金迷

可以看到“世間人都笑我太瘋癲”和“你不知道rapper付出多少才配紙醉金迷”占據(jù)了我們生成的結果。mode collapse，簡單來說就是輸入的改變不會影響生成的結果。為此我們調(diào)研了一些 Paper，最終采用了SentiGAN 中提出的 Penalty-based Objective Function：

3、押韻

嘻哈歌詞非常重要的一個特點就是句與句之間的押韻，我們在實現(xiàn)這一功能的時候嘗試了兩種方案：

1.Reward based，在 reward 函數(shù)上增加額外的押韻獎賞項， r(rhyme)：對 Generator 的生成的句子和輸入的句子進行押韻的判斷，如果押韻，則提供額外的獎賞。

2.Rule-based，生成時只對押韻的詞進行采樣：在生成句尾的詞的概率分布時候，通過獲取和輸入句尾押韻的詞，只在這些押韻的詞進行采樣。

方法一，如果能夠通過設計 reward function 就能實現(xiàn)押韻的功能，那模型就是完全 end2end，非常 fancy 了。但是理想很豐滿，現(xiàn)實很骨感，經(jīng)過幾天的調(diào)整押韻獎賞的權重，都沒能看到押韻率（我們設置的用于檢測押韻獎賞效果的指標，每個 batch 中和 input 押韻的句子的比例）的上升。我們懷疑是這種獎賞的結合會讓 Generator 產(chǎn)生混淆，并不能明確自己 reward 來自何處，應該需要更加具體的一些限制才能夠實現(xiàn)這一方法。

方法二，一開始我是拒絕這么做的，用基于規(guī)則的方法不是我的理想。但是為了做出產(chǎn)品來，我還是屈服了。但還有一個問題擺在面前：怎么知道生成的是句尾呢?導師提醒我們，我們可以把輸入倒過來。這是 NMT 中常用的一個手段，對于 LSTM，句子是真的還是反的差別不大，即使有差別，也可以通過一個 Bi-LSTM 來捕獲不同順序的信息。而為了知道哪些字詞是押韻的，我們實現(xiàn)制作了一張 vocab_size x vocab_size 的大表 rhyme，如果兩個詞（index 分別為 i, j）押韻，則 rhyme[i, j] 非 0，否則為 0。

如上圖所示，如果我們的輸入為“你真美麗”，句尾詞為“美麗”，韻腳為 i；最終采樣結果只會在押韻的詞中采樣，示例的采樣結果為“春泥”。

據(jù)此，我們就可以對生成過程的第一個詞的詞表分布進行一個 mask 操作，使得非押韻的詞的概率都變成 0，就能夠保證押韻了，代碼片段如下：

#獲取input的最后一個詞first_token=self.inputs[:,0]#(batch_size,1)#控制押韻的概率,現(xiàn)在設置為1.0，即100%押韻select_sampler=Bernoulli(probs=1.0,dtype=tf.bool)select_sample=select_sampler.sample(sample_shape=self.batch_size)#獲取對應的index押韻行token_rhyme=tf.cast(tf.gather(self.table,first_token),tf.float32)#進行maskprob_masked=tf.where(select_sample,tf.log(tf.multiply(token_rhyme,tf.nn.softmax(o_t))),tf.log(tf.nn.softmax(o_t)))#根據(jù)mask之后的概率分布進行采樣next_token=tf.cast(tf.reshape(tf.multinomial(prob_masked,1),[self.batch_size])

不過這個制表的過程比較耗費時間（大約跑了 3 個小時，i7）。另一種思路是可以根據(jù)韻腳對字詞進行分類，將相同韻腳的詞的 index 編到一起，這樣我們可以通過獲取每個詞的韻腳來知道目標詞的范圍，而不用挨個的去判斷是否押韻。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

AI

AI

+關注

關注
87

文章
29740

瀏覽量
268037
函數(shù)

函數(shù)

+關注

關注
3

文章
4276

瀏覽量
62313
生成器

生成器

+關注

關注
7

文章
313

瀏覽量
20939

原文標題：AI有嘻哈！

文章出處：【微信號：rgznai100，微信公眾號：rgznai100】歡迎添加關注！文章轉載請注明出處。

為什么只有藍色LED獲得了諾貝爾獎

電路元器件邏輯電路

學習電子知識

發(fā)布于 :2023年08月14日 20:09:04

慶科智慧應用創(chuàng)新設計大賽決賽圓滿落幕 S-max智能騎行頭盔斬獲頭獎

，獲得三等獎的則是施飛峰團隊的夾心餅電子積木項目。周忠S-max智能騎行頭盔路演現(xiàn)場前三甲隊伍與評委合影此外，有六支參賽隊伍的項目獲得了優(yōu)勝

發(fā)表于 12-21 21:48

第二屆“全志杯”微創(chuàng)客挑戰(zhàn)賽圓滿落幕，比派科技 Banana Pi作為官方合作伙伴全程參與

，來自中國科學院沈陽自動化研究所的sia-robot，重慶郵電大學的奶牛護衛(wèi)隊，電子科技大學/哈爾濱工業(yè)大學Robot+，分別獲得了最佳技術難度獎、

發(fā)表于 04-20 10:19

壯大隊伍呀！

迅速把隊伍壯大起來呀，我們是深圳市阿米諾技術有限公司，專業(yè)做智能醫(yī)療產(chǎn)品，歡迎大家來進行技術交流。

發(fā)表于 09-30 13:27

為什么我用示例項目從EEPROM閱讀只獲得了0xFF？

我用示例項目從EEPROM寫和讀。但在閱讀方面，我只獲得了0xFF。

發(fā)表于 08-05 10:53

OpenHarmony開源開發(fā)者成長計劃—解決方案學生挑戰(zhàn)賽Demo Day

賽制說明Demo Day 是配套解決方案學生挑戰(zhàn)賽的活動，向全國各地的開發(fā)者展示參賽作品并評選一等獎的線上直播活動。本次大賽技術評審團已評選出十支參賽隊伍，來參加成長計劃學生挑戰(zhàn)賽Demo

發(fā)表于 09-22 10:01

Demo Day直播 | 成長計劃解決方案學生挑戰(zhàn)賽一等獎即將揭曉！

Demo Day直播 | 成長計劃解決方案學生挑戰(zhàn)賽一等獎即將揭曉！OpenAtom OpenHarmony開源開發(fā)者成長計劃解決方案學生挑戰(zhàn)賽Demo Day來襲！每一支隊伍心懷夢想

發(fā)表于 09-26 11:25

羅技推出便攜防水藍牙音箱嘻哈十足

最近極客之選體驗了一款音箱，不論是外觀還是聲音都嘻哈十足，我們一起來看看它有什么特別。不得不說，《中國有嘻哈》、《這！就是街舞》等節(jié)目的出現(xiàn)，令國內(nèi)的

發(fā)表于 03-28 10:17 ?4659次閱讀

5個AI隊伍竟然可以在《Dota2》戰(zhàn)勝人類5人隊伍

之前AI在中單solo打敗知名選手Dendi的事情過了很久了，同團隊開發(fā)的5個神經(jīng)網(wǎng)絡AI隊伍已經(jīng)能在《Dota2》中戰(zhàn)勝業(yè)余的人類5人隊伍。

發(fā)表于 07-25 11:18 ?3036次閱讀

AI在以數(shù)據(jù)為中心的極端操作中表現(xiàn)出高度的可靠性

Gyrfalcon Technology，Inc.(GTI)在Frost&Sullivan享有聲望的2019年最佳實踐獎頒獎典禮上獲得了2019年北美AI加速器芯片新產(chǎn)品創(chuàng)新

發(fā)表于 03-25 10:04 ?661次閱讀

億智電子獲評AI+芯片領域「AI最佳商用成長獎」

據(jù)悉，「AI最佳商用成長獎」的評審維度包含：商用落地領域類型與客戶數(shù)、商用問題解決能力、項目售前服務能力、售后客戶評價指數(shù)、KA客戶與年度合作金額等。一直以來，億智電子用

發(fā)表于 09-07 16:21 ?2359次閱讀

IBM已獲得認證的金牌服務提供商資格

IBM已幫助數(shù)百名客戶加快了自動化進程，包括與 Jaguar Land Rover和Pearson的合作，后者在2019年獲得了Blue Prism的``人民選擇獎‘’，并且與美國退伍

發(fā)表于 09-11 11:05 ?2306次閱讀

WXYZ 7050隊獲得了FTC項目的最高獎項啟迪獎

隊長。2019賽季遠征香港斬獲了冠軍聯(lián)盟隊長。在2020這個特殊的賽季，取得了北京市智能機器人大賽FTC項目一等獎，又獲得FTC南京邀請賽冠軍聯(lián)盟隊長和設計獎。最為激動人心的是在剛剛結束的FTC全國線上評審活動中，第一梯隊WXY

發(fā)表于 10-10 14:02 ?2537次閱讀

2020 年度最佳 5G 手機獎：魅族17系列手機拿獎到手軟！

魅族17系列手機最近是拿獎到手軟了，前不久剛剛獲得日本GOOD DESIGN AWARD 2020優(yōu)良設計獎，今天魅族17 Pro又獲得了CMC天鵝獎“ 2020 年度

發(fā)表于 11-05 16:13 ?1761次閱讀

Seucre-IC與合作伙伴獲得了硬件安全與信任（HOST）的最佳演示獎！

Secure-IC與NaghmehKarimi博士的團隊（SECRETS實驗室成員）及巴黎電信的合作者在2023年IEEE國際研討會上獲得了硬件安全與信任(HOST)的最佳硬件演示獎，這是具有標志性的硬件安全方面的會議，在加利福

發(fā)表于 05-18 10:04 ?813次閱讀

搜索歷史

用AI自動生成嘻哈歌詞的隊伍獲得了“最佳DEMO獎”

評論

為什么只有藍色LED獲得了諾貝爾獎

慶科智慧應用創(chuàng)新設計大賽決賽圓滿落幕 S-max智能騎行頭盔斬獲頭獎

第二屆“全志杯”微創(chuàng)客挑戰(zhàn)賽圓滿落幕，比派科技 Banana Pi作為官方合作伙伴全程參與

壯大隊伍呀！

為什么我用示例項目從EEPROM閱讀只獲得了0xFF？

OpenHarmony開源開發(fā)者成長計劃—解決方案學生挑戰(zhàn)賽Demo Day

Demo Day直播 | 成長計劃解決方案學生挑戰(zhàn)賽一等獎即將揭曉！

羅技推出便攜防水藍牙音箱嘻哈十足

5個AI隊伍竟然可以在《Dota2》戰(zhàn)勝人類5人隊伍

AI在以數(shù)據(jù)為中心的極端操作中表現(xiàn)出高度的可靠性

億智電子獲評AI+芯片領域「AI最佳商用成長獎」

IBM已獲得認證的金牌服務提供商資格

WXYZ 7050隊獲得了FTC項目的最高獎項啟迪獎

2020 年度最佳 5G 手機獎：魅族17系列手機拿獎到手軟！

Seucre-IC與合作伙伴獲得了硬件安全與信任（HOST）的最佳演示獎！