0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

20多年專注語音合成芯片公司分享:TTS芯片端是如何達(dá)到100%精準(zhǔn)合成的

智能語音 ? 來源:智能語音 ? 作者:智能語音 ? 2024-05-06 15:45 ? 次閱讀

我國漢字文化博大精深,雖然現(xiàn)在語音合成技術(shù)發(fā)展較為成熟,但仍無法做到100%的智能分析和識別,來滿足人們的需求習(xí)慣。
例如漢字“一”,在不同語境下有3種讀法,“一五一十”“一路平安”“一言為定”,大家可以讀讀看。
再例如數(shù)字“1”,電話號碼“010-62986600、15321801789”,日期“2018-01-01”,在電話號碼中大家習(xí)慣讀成“幺”,而在日期里又習(xí)慣性的讀成“一”。
這樣的場景還有很多很多,本文將向大家介紹在TTS芯片端,如遇到無法智能識別播報的情況下,利用“文本控制標(biāo)記”,使文本合成準(zhǔn)確率達(dá)到100%的。
我們以市場常見的TTS語音芯片VTX316為例,它支持10多種文本控制標(biāo)記,下面我們一一列舉,并加以說明。
控制標(biāo)記統(tǒng)一格式為“[XX]”,“XX”=標(biāo)記參數(shù),使用時只要將標(biāo)記放在需要調(diào)整的文本前即可。

1. 數(shù)字處理標(biāo)記[nX]

默認(rèn)設(shè)置下芯片會自動識別數(shù)字的含義,是按“號碼方式" OR "數(shù)值方式"進(jìn)行解讀
備注:“X”=0、1、2
[n0]=自動判斷
[n1]=按號碼方式
[n2]=按數(shù)值方式
舉例文本1:撥打62986600。有123公斤重。
說明:“62986600”會讀作“六二九八六六零零”。“123”讀作“一百二十三”
舉例文本2:[n2]撥打62986600。[n1]有123公斤重。
說明:“62986600”會讀作“六千二百九十八萬六千六百”?!?23”讀作“一二三”

2. 數(shù)字“1”的處理標(biāo)記[yX]

默認(rèn)設(shè)置下芯片會自動識別數(shù)字"1"的讀法,是讀“幺" OR "一"進(jìn)行解讀
備注:“X”=0、1
[y0]=讀成“幺”
[y1]=讀成“一”
舉例文本1:[y0]撥打010-62986600
說明:讀作“撥打零幺零,六二九八六六零零”
舉例文本2:[y1]撥打010-62986600
說明:讀作“撥打零一零,六二九八六六零零”

3. 標(biāo)點符號處理標(biāo)記[bX]

默認(rèn)情況下標(biāo)點符號的名稱是不進(jìn)行播報的
備注:“X”=0、1
[b0]=不播報標(biāo)點符號
[b1]=播報標(biāo)點符號
舉例文本:[b1]歡迎光臨,請進(jìn)!
說明:讀作“歡迎光臨 逗號 請進(jìn) 感嘆號”

4. 改變漢字讀音標(biāo)記[=X]

當(dāng)我們想改變原來漢字的讀音時可以用到這個標(biāo)記策略,比如更換一個字的發(fā)音或是多音字”
備注:“X”=要改變的讀音,格式為“漢語拼音”+“聲調(diào)”,聲調(diào)=1、2、3、4、5(輕聲)
舉例文本1:歡迎他們,歡迎他[=ni3]們,歡迎他[=wo3]們
說明:讀作“歡迎他們,歡迎你們,歡迎我們”
舉例文本2:解[=xie4]放濤用語音合成芯片,單位的單[=shan4]小虎也在用
說明:“解”會讀成“謝”,“單”會讀成“善”

5. 發(fā)音人設(shè)置標(biāo)記[mX]

VTX316TTS芯片支持8種發(fā)音人(音色),可通過[mX]標(biāo)記隨意切換。
備注:“X”=3、51、52、53、54、55、56、57,對應(yīng)的發(fā)音人如下
[m3]=曉玲,女聲(默認(rèn)設(shè)置)
[m51]=尹小堅,男聲
[m52]=易小強,男聲
[m53]=田蓓蓓,女聲
[m54]=唐老鴨,卡通聲
[m55]=小燕子,女童聲
[m56]=貝童,男童聲
[m57]=曉可,男童聲
舉例文本:[m3]你好,[m54]這是發(fā)音人設(shè)置的舉例。
說明:“你好”的發(fā)音人為女聲曉玲,“這是發(fā)音人設(shè)置的舉例”的發(fā)音人是卡通聲唐老鴨

6. 語速調(diào)節(jié)標(biāo)記[sX]

TTS芯片支持30級語速調(diào)節(jié)
備注:“X”=0~30,默認(rèn)設(shè)置為5,數(shù)值越大語速越快
舉例文本:歡迎使用[s10]宇音天下語音合成芯片
說明:“歡迎使用”的語速為5級,“宇音天下語音合成芯片”的語速為10級

7. 語調(diào)調(diào)節(jié)標(biāo)記[tX]

語音合成芯片可控制10級語調(diào)調(diào)整
備注:“X”=0~10,數(shù)值越大語調(diào)越高
舉例文本:歡迎使用[t8]宇音天下語音合成芯片
說明:“歡迎使用”的語調(diào)為5級,“宇音天下語音合成芯片”的語調(diào)為8級

8. 音量調(diào)節(jié)標(biāo)記[vX]

TTS語音芯片支持10級音量調(diào)整
備注:“X”=0~10,數(shù)值越大音量越大
舉例文本:歡迎使用[v8]宇音天下語音合成芯片
說明:“歡迎使用”的音量為5級,“宇音天下語音合成芯片”的音量為8級

9. 提示音處理標(biāo)記[xX]

語音合成芯片通常內(nèi)置多首提示音,例如"sound901",具體格式參芯片數(shù)據(jù)手冊。
備注:"X"=0、1
[x0]=不按提示音處理
[x1]=按提示音處理
舉例文本:[x0]sound901
說明:讀作“sound901”,會按照字母加數(shù)字的讀法播報

10. 中文拼音識別標(biāo)記[iX]

判斷是否將文本識別成拼音
備注:“X”=0、1
[x0]=不識別漢語拼音
[x1]=識別成拼音
舉例文本:[i1]歡迎shi3yong4宇yin1tian1xia4[i0]語音合cheng2系統(tǒng)
說明:讀作“歡迎使用宇音天下語音合cheng2系統(tǒng)”,“cheng2”會按照字母和數(shù)字逐字播報

11. 停頓(靜音)時間標(biāo)記[pX]

在有需要停頓的文本中插入該標(biāo)記,可靈活控制停頓時間
備注:“X”=停頓時間,單位毫秒(ms)
舉例文本:歡迎使用[p800]宇音天下[p350]TTS語音芯片
說明:播報“歡迎使用”后,停頓800毫秒,播報“宇音天下”,停頓350毫秒,播報“TTS語音芯片”

12. 恢復(fù)默認(rèn)合成參數(shù)標(biāo)記[d]

本參數(shù)標(biāo)記將合成參數(shù)恢復(fù)成默認(rèn)設(shè)置,除發(fā)音人標(biāo)記參數(shù)
舉例文本:[n1]123,[y1]010-62986600[d]123, 010-62986600
說明:讀作“一二三,零一零,六二九八六六零零,一百二十三,零幺零,六二九八六六零零”

經(jīng)過上面的介紹,在語音合成芯片端如何達(dá)到100%的準(zhǔn)確率,各位的思路是否已經(jīng)非常清晰了呢?

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    452

    文章

    50206

    瀏覽量

    420896
  • TTS
    TTS
    +關(guān)注

    關(guān)注

    0

    文章

    41

    瀏覽量

    10757
  • 語音合成芯片
    +關(guān)注

    關(guān)注

    0

    文章

    17

    瀏覽量

    7485
收藏 人收藏

    評論

    相關(guān)推薦

    語音提示器-WT3000A離在線TTS方案-打破語種限制/AI對話多功能支持

    TTS(Text To Speech )技術(shù)作為智能語音領(lǐng)域的重要組成部分,能夠?qū)⑽谋拘畔⑥D(zhuǎn)化為逼真的語音輸出,為各類硬件設(shè)備提供便捷的語音提示服務(wù)。本方案正是基于唯創(chuàng)知音的離在線
    的頭像 發(fā)表于 10-25 10:36 ?129次閱讀
    <b class='flag-5'>語音</b>提示器-WT3000A離在線<b class='flag-5'>TTS</b>方案-打破語種限制/AI對話多功能支持

    視頻時鐘合成芯片怎么用

    視頻時鐘合成芯片(Video Clock Synthesizer,VCS)是一種用于生成和調(diào)整視頻信號時鐘的電子設(shè)備,廣泛應(yīng)用于視頻處理、顯示、傳輸?shù)阮I(lǐng)域。它能夠?qū)⑤斎氲臅r鐘信號轉(zhuǎn)換成所需的視頻格式
    的頭像 發(fā)表于 10-10 11:17 ?176次閱讀

    WT2605C TTS在線語音合成芯片:賦能多行業(yè)領(lǐng)域,引領(lǐng)產(chǎn)品智能化

    作為一款集成了在線TTS功能的藍(lán)牙語音芯片,憑借其卓越的性能和廣泛的應(yīng)用領(lǐng)域,正引領(lǐng)著智能語音技術(shù)的新風(fēng)尚。
    的頭像 發(fā)表于 09-12 15:54 ?228次閱讀
    WT2605C <b class='flag-5'>TTS</b>在線<b class='flag-5'>語音</b><b class='flag-5'>合成</b><b class='flag-5'>芯片</b>:賦能多行業(yè)領(lǐng)域,引領(lǐng)產(chǎn)品智能化

    收款機(jī)TTS語音芯片新方案:WT3000T8,雙語合成流暢,字庫解碼多樣!

    一:方案背景概述隨著科技的飛速發(fā)展,人工智能和語音識別技術(shù)在各個領(lǐng)域都得到了廣泛應(yīng)用。其中,文本轉(zhuǎn)語音TTS)技術(shù)以其獨特的優(yōu)勢,在收款機(jī)語音播報收銀領(lǐng)域發(fā)揮著越來越重要的作用。本文
    的頭像 發(fā)表于 07-27 08:38 ?583次閱讀
    收款機(jī)<b class='flag-5'>TTS</b><b class='flag-5'>語音</b><b class='flag-5'>芯片</b>新方案:WT3000T8,雙語<b class='flag-5'>合成</b>流暢,字庫解碼多樣!

    VTX326藍(lán)牙TTS語音合成芯片賦能電子稱重一體機(jī)人機(jī)交互新革新

    引言 隨著科技的飛速發(fā)展,零售業(yè)正經(jīng)歷著前所未有的變革。北京宇音天下科技有限公司,作為行業(yè)的領(lǐng)跑者,推出了革命性的VTX326藍(lán)牙TTS語音合成芯片
    的頭像 發(fā)表于 07-26 17:24 ?311次閱讀

    基于康養(yǎng)大模型和健康設(shè)備平臺的智能藍(lán)牙語音合成芯片VTX326

    AI健康監(jiān)護(hù)智能體攜手VTX326藍(lán)牙TTS語音合成芯片,為健康管理插上了智慧的翅膀,從日常監(jiān)測到個性化指導(dǎo),每一個環(huán)節(jié)都融入了科技的便利與人文的關(guān)懷。它不僅是一個健康管理平臺,更是每
    的頭像 發(fā)表于 07-03 11:33 ?310次閱讀
    基于康養(yǎng)大模型和健康設(shè)備平臺的智能藍(lán)牙<b class='flag-5'>語音</b><b class='flag-5'>合成</b><b class='flag-5'>芯片</b>VTX326

    收款機(jī)TTS語音芯片新方案:WT3000T8,雙語合成流暢,字庫解碼多樣!

    TTS技術(shù)在收款機(jī)播報收銀中具有重要的應(yīng)用價值和發(fā)展前景。本方案采用WT3000T芯片增加語音功能。不但可用耳朵聽語音播報收款的情況等(依用戶需求設(shè)置),而且可以播放音樂或英語口語美文
    的頭像 發(fā)表于 06-26 11:17 ?554次閱讀
    收款機(jī)<b class='flag-5'>TTS</b><b class='flag-5'>語音</b><b class='flag-5'>芯片</b>新方案:WT3000T8,雙語<b class='flag-5'>合成</b>流暢,字庫解碼多樣!

    中英文語音合成芯片TTS芯片)WT3000T8-在ETC上的應(yīng)用案例

    隨著智能化浪潮的推進(jìn),ETC(電子不停車收費)系統(tǒng)已逐漸成為現(xiàn)代交通的重要組成部分。在這一背景下,唯創(chuàng)知音自主研發(fā)的WT3000T8中文轉(zhuǎn)語音合成芯片TTS
    的頭像 發(fā)表于 05-28 09:47 ?368次閱讀

    為什么說TTS語音合成芯片的廣泛應(yīng)用,低功耗才是關(guān)鍵

    是如何為TTS(Text-to-Speech)技術(shù)賦予新的節(jié)能生命。 ? 智能休眠:精確響應(yīng)的節(jié)能藝術(shù) 關(guān)鍵詞:智能休眠機(jī)制、Deep Sleep命令 不同于直覺中芯片自我決策的休眠模式,現(xiàn)代低功耗語音
    的頭像 發(fā)表于 05-21 10:03 ?476次閱讀

    【解讀】VTX316 TTS語音合成芯片幾個很實用的應(yīng)用技巧

    ? 前言 VTX316是北京宇音天下科技有限公司最新推出的一款更具性價比的中文TTS語音合成芯片,采用QFN32(4*4mm)封裝,體積更加
    的頭像 發(fā)表于 05-13 16:33 ?378次閱讀

    WT3000T8-TTS語音合成芯片及應(yīng)用場景介紹

    TTS語音合成芯片是一種能夠?qū)⑽谋拘畔⑥D(zhuǎn)化為自然語音的專用芯片。它通過內(nèi)置的
    的頭像 發(fā)表于 04-18 18:03 ?800次閱讀

    玩轉(zhuǎn)語音合成芯片TTS芯片),看這一篇就夠了

    什么是語音合成芯片語音合成芯片也稱為TTS
    的頭像 發(fā)表于 03-19 18:13 ?1261次閱讀
    玩轉(zhuǎn)<b class='flag-5'>語音</b><b class='flag-5'>合成</b><b class='flag-5'>芯片</b>(<b class='flag-5'>TTS</b><b class='flag-5'>芯片</b>),看這一篇就夠了

    語音合成技術(shù)在智能駕駛中的應(yīng)用與挑戰(zhàn)

    。 二、語音合成技術(shù)在智能駕駛中的應(yīng)用 導(dǎo)航與路線指引:語音合成技術(shù)為駕駛員提供了清晰、自然的語音導(dǎo)航指引,確保駕駛的安全性和準(zhǔn)確性。駕駛員
    的頭像 發(fā)表于 02-02 10:34 ?377次閱讀

    語音合成技術(shù)在智能駕駛中的創(chuàng)新與應(yīng)用

    一、引言 隨著智能駕駛技術(shù)的不斷發(fā)展,人機(jī)交互變得越來越重要。語音合成技術(shù)作為人機(jī)交互的重要手段,在智能駕駛中發(fā)揮著越來越重要的作用。本文將探討語音合成技術(shù)在智能駕駛中的創(chuàng)新與應(yīng)用,并
    的頭像 發(fā)表于 02-01 18:09 ?592次閱讀

    語音合成技術(shù)在智能駕駛中的應(yīng)用與展望

    一、引言 隨著科技的飛速發(fā)展,語音合成技術(shù)逐漸成為人機(jī)交互領(lǐng)域的重要分支。在智能駕駛環(huán)境中,語音合成技術(shù)更是發(fā)揮著不可或缺的作用。它不僅簡化了人機(jī)交互過程,還為駕駛員提供了更加便捷、安
    的頭像 發(fā)表于 02-01 17:50 ?479次閱讀