0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于中文語音合成模塊XF-S4240實(shí)現(xiàn)語音車載終端的設(shè)計(jì)

電子設(shè)計(jì) ? 來源:電子設(shè)計(jì)工程 ? 作者:夏愛華,黃永強(qiáng),劉 ? 2021-03-31 16:34 ? 次閱讀

作者:夏愛華,黃永強(qiáng),劉聰,張輝

1 引言

據(jù)廣州市公布的《2005年廣州市交通發(fā)展年度報(bào)告》統(tǒng)計(jì),2005年廣州市機(jī)動車擁有量為177.4萬輛;據(jù)《法制晚報(bào)》報(bào)道2006年5月份北京機(jī)動車保有量可突破300萬輛。奧運(yùn)時(shí)將突破330萬輛;而據(jù)2006年GSM協(xié)會公布的一組數(shù)據(jù)稱:GSM手機(jī)用戶數(shù)量超過20億,中國市場最大。以上三組不同的數(shù)據(jù)顯示:越來越多的人在駕駛著機(jī)動車并通過GSM終端與外界進(jìn)行通訊。

現(xiàn)階段,許多機(jī)動車輛都安裝了車載終端。它主要用于車載導(dǎo)航、車輛調(diào)度、車載監(jiān)控等。而許多終端設(shè)備是依靠手工操作顯示終端來完成的,如駕駛員查看車輛調(diào)度中心或朋友發(fā)來的重要短消息。查看導(dǎo)航終端的地圖等。這樣就導(dǎo)致司機(jī)開車時(shí)不能專心,其直接后果可能導(dǎo)致嚴(yán)重的交通事故。

語音交流是人類最自然的交流方式,如果車載終端的很多操作可由實(shí)時(shí)的語音來代替的話,將有利于減少交通事故的發(fā)生率。例如,GSM Modem收到短消息,司機(jī)不用手動查看。語音合成系統(tǒng)可以自動播報(bào)出來;可以實(shí)時(shí)地提示司機(jī)行駛的方向與路名;可以實(shí)時(shí)地將交通狀況播報(bào)出來。讓駕駛員了解當(dāng)前交通狀況,通過了解道路交通擁堵的實(shí)時(shí)信息,從而避開擁堵路段,更快到達(dá)目的地等。語音合功能成的車載終端可提高車載終端的智能性、車輛駕駛的安全性和舒適性,使用戶使用起來更加方便,更具有人性化。

2 語音合成及GSM M0dem

2.1 語音合成技術(shù)

語音合成技術(shù)是利用計(jì)算機(jī)、智能系統(tǒng)等設(shè)備,按預(yù)定的程序和指令,人為產(chǎn)生音素、音節(jié)、詞和句子的技術(shù)。

目前,語音合成技術(shù)已發(fā)展到能實(shí)時(shí)地將任意文本轉(zhuǎn)換成連續(xù)可懂的自然語句輸出,相應(yīng)技術(shù)通常稱為文語合成或文語轉(zhuǎn)換(Text To Speech,簡稱TTS),涉及到聲學(xué)、語言學(xué)、語音數(shù)字信號處理技術(shù)、多媒體技術(shù)等多個(gè)學(xué)科。文語合成的原理:根據(jù)韻律建模的結(jié)果,從原始語音庫中取出相應(yīng)的語音基元,利用特定的語音合成技術(shù)對語音基元進(jìn)行韻律特性的調(diào)整和修改,最終合成出符合實(shí)際的語音。

基于中文語音合成模塊XF-S4240實(shí)現(xiàn)語音車載終端的設(shè)計(jì)

2.2 語音合成模塊

本設(shè)計(jì)采用安徽中科大訊飛信息科技有限公司研發(fā)的一款高端中文語音合成模塊XF-S4240。該模塊可通過UART、SPI和12C三種接口接收待合成的文本,直接合成為語音輸出(Line out)。

該模塊采用。InterSound4.0 KT系統(tǒng)作為模塊內(nèi)核,一個(gè)是輕量級中文連續(xù)語音合成系統(tǒng)。

XF-S4240模塊的特點(diǎn)如下:支持任意中文文本的合成。支持英文字母的合成,遇到英文單詞時(shí)按字母方式發(fā)音;支持四種內(nèi)碼格式:GB2312(簡體中文編碼)、GBK(國家標(biāo)準(zhǔn)擴(kuò)展編碼)、Unicode(字符編碼)、Big5(繁體中文編碼);具有雙發(fā)音人:男聲、女聲;具有智能的文本分析處理算法,可正確識別和處理數(shù)值、號碼、時(shí)間日期及一些常用的度量衡符號,具備較強(qiáng)多音字處理和中文姓氏處理能力;支持軟件調(diào)節(jié)語速、語調(diào)、音量等。 2.3 GSM Modem

GSM Modem是繼GSM手機(jī)后又一種非常重要的GSM移動通信系統(tǒng)的終端設(shè)備。GSM Modem作為一種主要的GSM網(wǎng)絡(luò)接入設(shè)備,它是傳統(tǒng)調(diào)制解調(diào)器與GSM無線移動通信系統(tǒng)相結(jié)合的一種數(shù)據(jù)終端設(shè)備,因此也叫無線調(diào)制解調(diào)器。它的出現(xiàn)打開了GSM網(wǎng)絡(luò)數(shù)據(jù)通信及其應(yīng)用的大門。本設(shè)計(jì)采用西門子公司生產(chǎn)的第三代GSM雙頻ModemTC35i,該模塊可廣泛應(yīng)用于POS終端、手持式設(shè)備、移動電腦、無線電話、交通控制和導(dǎo)航系統(tǒng)、快速管理安全系統(tǒng)、遠(yuǎn)程監(jiān)視、遠(yuǎn)程抄表、自動售賣機(jī)等系統(tǒng)。

3 車載終端的硬件設(shè)計(jì)

系統(tǒng)硬件是以廣州周立功單片機(jī)發(fā)展有限公司的ARM7系列Smart ARM2200嵌入式平臺為基礎(chǔ)。平臺主控制器采用飛利浦公司生產(chǎn)的16/32位ARM7TDMI-S微控制器IPC2210,它具有豐富的外部接口,例如工業(yè)標(biāo)準(zhǔn)的UART、高速的I2C接口(400 kb/s)、SPI接口、A/D轉(zhuǎn)換接口等,可以方便地與其他外設(shè)互連。

系統(tǒng)底層軟件采用μCliunx內(nèi)核,該內(nèi)核是針對微控制領(lǐng)域而設(shè)計(jì)的Linux系統(tǒng),適合無內(nèi)存管理單元(MMU)的微控制器。

XF-S4240模塊可通過UART、SPI和I2C接口實(shí)現(xiàn)與其他終端設(shè)備的通訊。本系統(tǒng)設(shè)計(jì)利用SmartARM2200嵌入式平臺的I2C接口與XF-S4240的12C接口進(jìn)行通訊。XF-S4240設(shè)置為從設(shè)備,默認(rèn)地址為0x80,Smart ARM2200設(shè)置為主設(shè)備。GSM Modem則通過標(biāo)準(zhǔn)UART口與SmartARM2200嵌入式系統(tǒng)的通用串口2連接。

o4YBAGBvzU6AQZHMAABPMQL5c2Y248.png

4 軟件設(shè)計(jì)

4.1 語音模塊合成的通訊協(xié)議

無論XF-S4240采用UART、SPI還是I2C與其他智能系統(tǒng)連接,語音合成模塊的上層通訊協(xié)議是相同的,下面將介紹語音合成的控制命令。

發(fā)送給XF-S4240的所有命令與數(shù)據(jù)均采用“幀”的方式進(jìn)行數(shù)據(jù)封裝后傳輸。

pIYBAGBvzWCAQxLDAAAgp_BoyG4239.png

其中,幀頭長度為一個(gè)字節(jié),定義為16進(jìn)制“0xFD”;數(shù)據(jù)區(qū)長度占兩個(gè)字節(jié),高字節(jié)在前,低字節(jié)在后。數(shù)據(jù)區(qū)長度不定,但須小于1 024個(gè)字節(jié)。數(shù)據(jù)區(qū)包含命令字、命令參數(shù)和合成的語音信息。

o4YBAGBvzYWAII2CAABOzb519AU465.png

此幀的含義:0xFD表示幀頭,0x00 0x0A表示數(shù)據(jù)區(qū)長度為10個(gè)字節(jié)。0x01表示語音合成命令,0x00表示文本格式為GB2312,剩余的16進(jìn)制編碼為中山大學(xué)的GB2312編碼。

4.2 TC35i GSM Modem的通訊協(xié)議

TC35i GSM Modem與其他終端采用通用串行接口進(jìn)行通訊,通訊協(xié)議采用AT指令集。本設(shè)計(jì)主要讀取GSM Modem的短消息。而與短消息收發(fā)有關(guān)的規(guī)范主要包括GSM 03.38,GSM 03.40和GSM07.05。前兩者重點(diǎn)描述的是SMS技術(shù)實(shí)現(xiàn)(編碼方式),后者規(guī)定了SMS的DTE-DCE接口標(biāo)準(zhǔn)(AT命令集)。AT指令是以AT為開頭,如AT+CMGL=0(GSM 07.05版本)表示讀取最新收到的短消息,AT+CMGC表示發(fā)出一條短消息等。

短消息共有3種接收與發(fā)送模式:Block Mode(塊模式),Text Mode(文本模式)和PDU Mode(PDU模式)。PDU模式最常用,支持所有手機(jī),可以使用任何字符集。下面給出一個(gè)PDU模式下的ASCII串,其短消息中心號碼(SMSC)是+8613800200500,發(fā)送者號碼是13826468897.消息內(nèi)容是“中山大學(xué)”,則通過讀取它的“PDU串”是:“08 9l 68 3l 0820 00 05 F0 04 0D 91 68 31 28 46 86 98 F7 00 0860 30 02 11 82 21 80 08 D0 D6 BD C9 F3 B4 A7D1”。通過以上這個(gè)PDU串得知.要得到需要的用戶信息就必須對“PDU串”進(jìn)行解碼。下面給出“PDU串”解碼的數(shù)據(jù)結(jié)構(gòu)。

4.3 應(yīng)用程序的設(shè)計(jì)與流程

嵌入式平臺SmartARM220的應(yīng)用程序是運(yùn)行于μCliunx內(nèi)核之上,應(yīng)用程序不能直接對硬件操作。為了實(shí)現(xiàn)硬件與外部設(shè)備通訊,必須調(diào)用相應(yīng)的設(shè)備驅(qū)動程序。本文主要涉及UART驅(qū)動、I2C驅(qū)動,嵌入式驅(qū)動程序的設(shè)計(jì)方法在這里省略。

pIYBAGBvzZiAaks7AACxXqdod64253.png

5 結(jié)束語

基于語音合成技術(shù)和語音模塊XF-S4240的車載終端可廣泛應(yīng)用于導(dǎo)航系統(tǒng)、車載調(diào)度、車載監(jiān)控等。由于該技術(shù)的通用性,它還可應(yīng)用于其他需要語音合成技術(shù)的場合,如排隊(duì)叫號系統(tǒng),公交報(bào)站器等。目前語音識別技術(shù)雖已取得很大的成績,但效果不如語音合成技術(shù),相信不久人們就可利用更加先進(jìn)的語音技術(shù)自然地與機(jī)器進(jìn)行交流!

責(zé)任編輯:gt

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 調(diào)制解調(diào)器

    關(guān)注

    3

    文章

    836

    瀏覽量

    38594
  • 無線
    +關(guān)注

    關(guān)注

    31

    文章

    5378

    瀏覽量

    172436
  • 計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7168

    瀏覽量

    87142
收藏 人收藏

    評論

    相關(guān)推薦

    車載導(dǎo)航人機(jī)語音交互系統(tǒng)的實(shí)現(xiàn)

    實(shí)現(xiàn)常規(guī)的手動交互方式,也可以實(shí)現(xiàn)語音交互方式。整個(gè)系統(tǒng)劃分為三個(gè)子系統(tǒng):導(dǎo)航子系統(tǒng)、語音識別子系統(tǒng)和語音
    發(fā)表于 08-15 21:27

    SYN6288語音合成芯片全開發(fā)

    經(jīng)常搞各種語音芯片,發(fā)現(xiàn)SYN6288芯片合成功能很強(qiáng)大,功能很好用,于是趁星期六星期天的時(shí)間,搞了一下它的程序,發(fā)現(xiàn)這個(gè)片子很好用,它的功能如下:SYN6288 中文語音
    發(fā)表于 12-02 08:36

    語音合成芯片與語音芯片對比

    目前市面上的可發(fā)聲芯片分為兩大類:語音合成芯片與語音芯片。在實(shí)際開發(fā)語音終端產(chǎn)品工作中,有很多的研發(fā)人員在這兩類芯片的認(rèn)知上難免會出現(xiàn)概念上
    發(fā)表于 03-08 17:26

    語音合成芯片與語音芯片對比

    目前市面上的可發(fā)聲芯片分為兩大類:語音合成芯片與語音芯片。在實(shí)際開發(fā)語音終端產(chǎn)品工作中,有很多的研發(fā)人員在這兩類芯片的認(rèn)知上難免會出現(xiàn)概念上
    發(fā)表于 03-11 15:39

    車載導(dǎo)航人機(jī)語音交互系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)

    實(shí)現(xiàn)語音交互方式。整個(gè)系統(tǒng)劃分為三個(gè)子系統(tǒng):導(dǎo)航子系統(tǒng)、語音識別子系統(tǒng)和語音合成子系統(tǒng),各子系統(tǒng)間通過接口進(jìn)行通信,協(xié)調(diào)完成
    發(fā)表于 05-07 07:00

    C51軟件模擬實(shí)現(xiàn)SPI通信接口的方法

    開發(fā)中得到了驗(yàn)證。1 語音模塊XF-S4240XF-S4240中文語音合成
    發(fā)表于 05-16 07:00

    語音合成IC與語音IC的兩三事

    通訊方式,接收待合成的文本數(shù)據(jù),實(shí)現(xiàn)文本到語音(或TTS語音)的轉(zhuǎn)換。其特性是:支持任意中文文本的合成
    發(fā)表于 05-13 17:02

    語音合成IC選型之經(jīng)驗(yàn)分享

    `語音合成芯片,又稱TTS芯片,通過UART接口或SPI接口通訊方式,接收待合成的文本數(shù)據(jù),實(shí)現(xiàn)文字轉(zhuǎn)語音
    發(fā)表于 05-19 14:37

    中文語音合成芯片XFS3011電子資料

    概述:XF-S3011芯片是安徽中科大訊飛信息科技有限公司研發(fā)的一款中文語音合成芯片,將完整的語音合成
    發(fā)表于 04-21 07:02

    基于語音合成技術(shù)的車載終端系統(tǒng)該怎樣去設(shè)計(jì)?

    什么是語音合成技術(shù)?基于語音合成技術(shù)的車載終端系統(tǒng)該怎樣去設(shè)計(jì)?
    發(fā)表于 05-12 07:25

    XFS5152CE語音合成模塊

    TTS是Text To Speech的縮寫,即“從文本到語音”,是人機(jī)對話的一部分,讓機(jī)器能夠說話。語音播報(bào)功能的實(shí)現(xiàn)方式TTS語音模塊,比
    發(fā)表于 08-12 08:14

    基于短信和語音合成的報(bào)警接口設(shè)計(jì)

    本文采用手機(jī)模塊TC35i和語音合成模塊XF-S3011構(gòu)成短信和語音報(bào)警的智能接口,它在短信收
    發(fā)表于 07-29 16:17 ?38次下載

    基于DSP的中文語音合成系統(tǒng)設(shè)計(jì)

    基于DSP的中文語音合成系統(tǒng)設(shè)計(jì) 引言   本文介紹的就是一種基于DSP的中文語音合成系統(tǒng)
    發(fā)表于 10-09 14:50 ?1251次閱讀
    基于DSP的<b class='flag-5'>中文</b><b class='flag-5'>語音</b><b class='flag-5'>合成</b>系統(tǒng)設(shè)計(jì)

    XF-S4240中文語音合成模塊原理簡介及分析

    XF-S4240 中文語音合成模塊,是安徽中科大訊飛信息科技有限公司(科大訊飛)推出的基于科大訊飛在嵌入式
    發(fā)表于 05-25 09:56 ?4190次閱讀

    TTS語音合成技術(shù)及其應(yīng)用

    。 TTS語音合成技術(shù)已經(jīng)廣泛應(yīng)用于各個(gè)領(lǐng)域,如語音助手、智能客服、車載導(dǎo)航等。在語音助手方面,TTS
    的頭像 發(fā)表于 06-24 02:28 ?1065次閱讀