0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

云知聲基于語音合成技術(shù),上線方言合成功能

云知聲 ? 來源:云知聲 ? 2023-10-31 09:45 ? 次閱讀

“少小離家老大回,鄉(xiāng)音無改鬢毛衰?!?/p>

方言,不僅是地域風物的承載,更是人與故土聯(lián)結(jié)的情感紐帶。隨著人們對智能語音需求的越來越多元化,更具鄉(xiāng)土氣息、更具情感聯(lián)結(jié)的方言語音正成為智能語音合成的熱門方向。

近期,云知聲基于語音合成技術(shù),上線方言合成功能,以 AI 傳遞鄉(xiāng)音鄉(xiāng)情。

1AI遇上方言,“智”取鄉(xiāng)音一片

伴隨普通話的推廣普及,以及城市流動人口的增加,方言正悄悄退出人們的生活,一些地方方言甚至瀕臨失傳的境遇。讓方言走進日常,以更多樣化的形式“活”起來,已成為當前方言保護工作的重中之重。

為助力鄉(xiāng)音傳續(xù),同時也更好滿足人們對智能語音的多樣化需求,云知聲基于最新語音合成深度學習技術(shù),全面學習方言音色、風格,合成貼近真人的“數(shù)字鄉(xiāng)音”,讓人工智能科技溫度浸潤到多個智能語音應(yīng)用場景——

智能家居而言,用熟悉的鄉(xiāng)音和用戶對話,既能夠慰藉用戶身居異地的思鄉(xiāng)之情,也有助于打造產(chǎn)品差異化優(yōu)勢,更好開拓下沉市場;在智能客服領(lǐng)域,很多老人、弱勢群體既不會講普通話,也聽不懂普通話,方言的引入能夠大大減少雙方溝通成本,提高服務(wù)效率;直播間里,搞笑幽默的方言既能夠讓直播內(nèi)容更有趣味性,也迎合了受眾聽鄉(xiāng)音、知鄉(xiāng)情的心理需求,增加了用戶黏性……

2遷移學習,讓方言合成成為現(xiàn)實

讓人工智能“說”出一口普通話已然不易,合成方言更是難上加難。

一直以來,方言合成存在兩大難點:

一是難以獲取大量高質(zhì)量的語音數(shù)據(jù)和對應(yīng)的文本信息,二是不同地區(qū)的方言之間相互獨立,在音調(diào)、聲母、韻母等方面有所差異,很難進行精確的發(fā)音和韻律標注,這無疑增加了數(shù)據(jù)標注和技術(shù)開發(fā)的難度。

利用遷移學習技術(shù),云知聲解決了以上問題,得以在短時間內(nèi)將單個發(fā)音人的音色合成粵語、四川話等方言以及英語等外語。

針對部分方言的特性,云知聲先是通過超大規(guī)模的高質(zhì)量普通話數(shù)據(jù),訓練得到端到端聲學模型和神經(jīng)網(wǎng)絡(luò)聲碼器等基礎(chǔ)模型;然后,利用較大規(guī)模低質(zhì)量的方言數(shù)據(jù)對基礎(chǔ)模型進行遷移學習,使其能更好地適應(yīng)方言的語音特點;最后,使用少量較高質(zhì)量的方言數(shù)據(jù)再次對基礎(chǔ)模型進行遷移學習,最終訓練得到方言合成模型。

在遷移學習技術(shù)的支持下,云知聲TTS已實現(xiàn)粵語、四川話及純正美音的合成,可覆蓋人機對話、影視配音、直播帶貨等多種場景需求,助力更多客戶實現(xiàn)方言及個性化聲音解決方案的落地。

通過方言合成技術(shù),云知聲數(shù)字人也得以開口說“鄉(xiāng)音”,熟練“掌握”多種方言,甚至做到流暢切換。

自由切換多種方言的數(shù)字人

除了方言合成,此次,云知聲TTS還上線了rap合成功能,即使用戶五音不全,也能秒變說唱歌手,輕松玩轉(zhuǎn)freestyle。

從智能家居到呼叫中心,從生活娛樂到辦公學習,云知聲智能語音技術(shù)正不斷打破場景限制,讓AI以更豐富的聲音形象融入日常。

目前,云知聲TTS已上線28種發(fā)音人音色、64種音色風格,極大程度上滿足了用戶的多場景合成語音應(yīng)用需求。

面向未來,云知聲TTS將繼續(xù)解鎖更多音色、風格,覆蓋更多應(yīng)用場景,全力滿足客戶的個性化、差異化定制需求。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28875

    瀏覽量

    266212
  • 語音合成
    +關(guān)注

    關(guān)注

    2

    文章

    86

    瀏覽量

    16096
  • 云知聲
    +關(guān)注

    關(guān)注

    0

    文章

    145

    瀏覽量

    8331

原文標題:新“聲”報道!云知聲TTS上線方言合成功能

文章出處:【微信號:云知聲,微信公眾號:云知聲】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    攜手耘途教育成立學院福建分院

    近日,與耘途教育攜手,共同成立了學院福建分院,此舉標志著雙方在智慧教育領(lǐng)域展開了深度合作。根據(jù)合作協(xié)議,
    的頭像 發(fā)表于 05-13 10:38 ?305次閱讀

    攜手耘途教育成立學院福建分院,探索智慧教育新思路

    近日,與耘途教育聯(lián)合成學院福建分院,深入探索智慧教育新模式、新思路。
    的頭像 發(fā)表于 05-11 15:52 ?420次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b>攜手耘途教育成立<b class='flag-5'>云</b><b class='flag-5'>知</b>學院福建分院,探索智慧教育新思路

    攜山海大模型再赴港IPO

    智能科技股份有限公司(簡稱“”)于3月15日更新了招股書,繼續(xù)其在港交所主板上市的步
    的頭像 發(fā)表于 03-22 14:51 ?564次閱讀

    推進港交所主板上市進程

    近日,智能科技股份有限公司(以下簡稱“”)再次更新招股書,繼續(xù)其在港交所主板上市的征
    的頭像 發(fā)表于 03-22 14:45 ?755次閱讀

    再闖港股IPO

    近日,備受矚目的智能科技股份有限公司(以下簡稱)再次更新了其招股書,繼續(xù)穩(wěn)步推進其在
    的頭像 發(fā)表于 03-22 14:42 ?539次閱讀

    玩轉(zhuǎn)語音合成芯片(TTS芯片),看這一篇就夠了

    什么是語音合成芯片:語音合成芯片也稱為TTS芯片,即文字轉(zhuǎn)語音芯片,是一種能夠?qū)⑤斎氲奈淖中畔⑥D(zhuǎn)換為語音
    的頭像 發(fā)表于 03-19 18:13 ?1081次閱讀
    玩轉(zhuǎn)<b class='flag-5'>語音</b><b class='flag-5'>合成</b>芯片(TTS芯片),看這一篇就夠了

    再闖港股IPO,深耕AI領(lǐng)域

    近日,智能科技股份有限公司(簡稱:)正式向港交所遞交了招股書,計劃主板IPO上市。這
    的頭像 發(fā)表于 03-19 15:36 ?683次閱讀

    再次沖刺港交所上市

    備受矚目的“AI語音第一股”智能科技股份有限公司(簡稱“
    的頭像 發(fā)表于 03-19 14:59 ?743次閱讀

    山海大模型獲得華為昇騰技術(shù)認證

    山海大模型近日取得了重大突破,順利通過了華為Atlas 800訓練服務(wù)器和華為AI框架昇思MindSpore的兼容性測試。這一成就標志著
    的頭像 發(fā)表于 02-05 09:32 ?822次閱讀

    語音合成技術(shù)在智能駕駛中的應(yīng)用與挑戰(zhàn)

    一、引言 隨著智能駕駛技術(shù)的不斷發(fā)展,人機交互變得越來越重要。語音合成技術(shù)作為人機交互的重要手段,在智能駕駛中發(fā)揮著越來越重要的作用。本文將探討語音
    的頭像 發(fā)表于 02-02 10:34 ?314次閱讀

    語音合成技術(shù)在智能駕駛中的創(chuàng)新與應(yīng)用

    一、引言 隨著智能駕駛技術(shù)的不斷發(fā)展,人機交互變得越來越重要。語音合成技術(shù)作為人機交互的重要手段,在智能駕駛中發(fā)揮著越來越重要的作用。本文將探討語音
    的頭像 發(fā)表于 02-01 18:09 ?514次閱讀

    語音合成技術(shù)在智能駕駛中的應(yīng)用與展望

    一、引言 隨著科技的飛速發(fā)展,語音合成技術(shù)逐漸成為人機交互領(lǐng)域的重要分支。在智能駕駛環(huán)境中,語音合成技術(shù)
    的頭像 發(fā)表于 02-01 17:50 ?400次閱讀

    方言離線語音控制場景解決方案

    情況下,留守老人和小孩說方言比較多,在雷龍離線語音模塊 自定義語音的幫助下,老人或小孩不再需要手動操作復雜的電子設(shè)備。他們只需對設(shè)備用方言說出自己的需求,即可實現(xiàn)設(shè)備的控制。這一
    發(fā)表于 11-17 17:57

    科普語音芯片和語音合成芯片的不同之處

     可發(fā)聲芯片分為語音芯片和語音合成芯片,二者在技術(shù)和用途上不同。語音合成芯片能將任意文字實時轉(zhuǎn)換
    的頭像 發(fā)表于 10-31 15:42 ?466次閱讀

    CAN總線的語音合成模塊研制技術(shù)

    電子發(fā)燒友網(wǎng)站提供《CAN總線的語音合成模塊研制技術(shù).pdf》資料免費下載
    發(fā)表于 10-13 10:25 ?0次下載
    CAN總線的<b class='flag-5'>語音</b><b class='flag-5'>合成</b>模塊研制<b class='flag-5'>技術(shù)</b>