IBM Watson Text to Speech API,它能夠?qū)⑽谋竞铣蔀槎喾N語(yǔ)言、聲音和方言的音頻。這里面“Allison”的聲音音色很甜、很有吸引力,特別契合我的書中主人公 Hailee Tupper 的年齡和性格特點(diǎn)。
有這樣一種說(shuō)法,一張圖片勝過(guò)千言萬(wàn)語(yǔ)。但事實(shí)上,清晰、措辭得當(dāng)、音調(diào)和發(fā)音準(zhǔn)確的口頭語(yǔ)言能夠更好地營(yíng)造最難忘、最美好的畫面。而人工智能已經(jīng)取得了顯著的進(jìn)展,能夠完成上述表達(dá)要求。
我想知道能否用一個(gè)女性人工智能聲音來(lái)演繹我所著的“Miraculous”一書中的主角,以讓人信服的方式讓聽(tīng)眾相信她就是書中的真實(shí)角色。
我如何借助 Watson API 賦予主角生命
在對(duì)多家公司的多個(gè)不同的 AI 角色進(jìn)行試音后,我最終選擇了 IBM Watson Text to Speech API,它能夠?qū)⑽谋竞铣蔀槎喾N語(yǔ)言、聲音和方言的音頻。我選擇了“Allison”的聲音,因?yàn)樗囊羯芴?、很有吸引力,同時(shí)也契合書中主人公 Hailee Tupper 的年齡。
為了幫助她演繹書中場(chǎng)景,我使用了文本轉(zhuǎn)語(yǔ)音 API 的表達(dá)功能“Expressiveness”,該功能可以使用情感元素?cái)U(kuò)展 SSML,而該情感元素能夠表達(dá)好消息 (GoodNews)、道歉 (Apology) 或不確定 (Uncertainty) 的說(shuō)話語(yǔ)氣(僅適用于美音 Allison 聲音)??梢赃M(jìn)一步了解 IBM Watson 情感語(yǔ)音服務(wù) Expressive SSML。
我的書中有數(shù)萬(wàn)個(gè)單詞組合,Watson Allison 的聲音能夠以不同的方式處理這些單詞組合。通過(guò)單獨(dú)使用或組合使用三個(gè)情感語(yǔ)音情緒中的一個(gè)或多個(gè)情緒,并在說(shuō)話時(shí)加上不同的停頓時(shí)間,她就能表達(dá)更多的情緒。
小說(shuō)角色說(shuō)話時(shí)會(huì)長(zhǎng)短不一,因此會(huì)影響到一句話停頓的次數(shù)和頻率,而這種停頓也需要計(jì)算。書中特定場(chǎng)景的總體情緒也會(huì)影響停頓的頻率,如說(shuō)話中止、語(yǔ)氣平靜和歡呼等。
下面,我將通過(guò)一個(gè)例子來(lái)展示上述技術(shù)有哪些作用。
若要完成此類項(xiàng)目,你是否必須成為一名 IT 人員或程序員?我不這么覺(jué)得。不論怎么想,我都不可能成為計(jì)算機(jī)人員或程序員。但是,我想說(shuō)的是,耐心、實(shí)踐和創(chuàng)意都是非常重要的因素。這就像是一個(gè)故事的導(dǎo)演。整個(gè)過(guò)程會(huì)涉及大量的復(fù)制粘貼工作。關(guān)鍵要知道如何將代碼粘貼至文本中的正確位置,最終達(dá)到預(yù)期效果。
假如您對(duì)此類項(xiàng)目感興趣,我非常愿意與你分享我的知識(shí)和專業(yè)技能,比如,通過(guò)一個(gè)免費(fèi)的視頻,幫助您取得最佳成果。
最后,我想說(shuō)的是,與 IBM Watson 合作是一段美妙、精彩的經(jīng)歷。如果有可能,我很希望能夠跟他握手致謝。
-
人工智能
+關(guān)注
關(guān)注
1791文章
46698瀏覽量
237188 -
Watson
+關(guān)注
關(guān)注
0文章
17瀏覽量
9495
原文標(biāo)題:Watson 如何幫助作者賦予書中主角以生命
文章出處:【微信號(hào):IBMGCG,微信公眾號(hào):IBM中國(guó)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論