0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

優(yōu)化lSD系列語音芯片的開發(fā)平臺設(shè)計方案介紹

電子設(shè)計 ? 來源:郭婷 ? 作者:電子設(shè)計 ? 2018-12-21 08:26 ? 次閱讀

目前,市場上的語音芯片和語音板很多,從性能價格比上看,美國1SD公司的ISD系列錄放芯片可謂是一支獨秀。1SD器件使用直接電平存儲技術(shù),省去了A/D、D/A轉(zhuǎn)換;內(nèi)部集成了大容量的EERPOM,不再需要擴展存儲器;控制簡單,控制管腳與TFL電平兼容。具有集成度高、音質(zhì)好、使用方便等優(yōu)點,是一種理想的語音處理芯片。

在控制上,除去手動外,lSD器件也可以通過地址尋址來精確定位,但它的地址不是字節(jié)地址單元,而是信息段的基本組成單位。以ISD2560為例,它內(nèi)部的480kB的EEPROM均勻地規(guī)劃為600行,每個地址單元指向其中一行,有600個地址單元。ISD2560的錄放時間是60s,因此地址分辨率是100ms。lSD器件可進行多段地址操作,每一段稱為一個信息段,它可以占用-行和多行存儲空間。-個地址單元最多只能作為一個獨立的段。因此,ISD2560最多可以分為600個信息段m。

2當前ISD芯片開發(fā)存在的問題

通常情況下,只能使用lSD器件提供的無需知道地址的操作模式,即手動模式,這只適合于開發(fā)語音玩具,而無法滿足復雜操作或?qū)崟r系統(tǒng)中應(yīng)用的要求。為實現(xiàn)以上應(yīng)用,最好使用對地址直接操作的辦法。但在實用中,一些電路開發(fā)設(shè)計只是在基于語音信號已經(jīng)寫人芯片,并且段地址已經(jīng)知道的基礎(chǔ)上才能進行。然而,不可避免地要遇到必須將語音寫入的時候。如果手動處理,采用按“錄音”按鍵錄音,“停止”按鍵停止,假如錄音段數(shù)特別多,就要頻繁地按上述按鍵,實在讓人疲憊不堪。此外,手動按下“錄音”及“停止”按鍵的時間也很難掌握,這就容易產(chǎn)生段間空白,造成芯片空間浪費,對語音段特別多,而語句又特別短的提示如一些單字、單詞更是浪費嚴重。不僅這樣,由于短句中空白時間過長,合成放音時出現(xiàn)語音不連貫。另外,直接對連接到1SD芯片的傳聲器錄音會造成情緒緊張,容易出錯,且無法對錄入的語音進行高級處理。

3 解決方法

基于上述原因,需要設(shè)計一種lSD語音開發(fā)平臺,借助傳聲器通過計算機的聲卡將所有待寫語音信號一并錄入計算機,存儲為*.wav文件,然后利用聲音剪輯軟件將各個詞語(短句)分離出來。因為如果不是同時錄音的話,對同一個人來說,其聲音在不同時間、不同場合、不同情緒時都會有著很大的差別。如電子體重計,“您的體重是五十一公斤,您的身高是一百七十二厘米”,應(yīng)該是由“您的、體重、身高、是、公斤、厘米、五、十、一、百、七、二”等12個詞合成后形成的,如果由于某種原因,引起了任何一個詞與其它語調(diào)不同,提示時就會顯得特別突出,聽起來有種怪怪的感覺。

若用計算機錄音,可以一并錄入很多段話(并非一定是全部需要的),然后從中選出所需詞語(短句)。因為這些話是在較短的時間內(nèi)完成的,所以不會有很大的語調(diào)變化,將從中選出的詞組合起來時也不會顯得牽強,聽起來感覺不到這些句子是由詞語拼湊起來的。

除此之外,如果有專業(yè)語音庫,還可以直接從其中抽出詞語來組成所需的句子,并且還省去了請專業(yè)錄音人員的開支。這樣還有一個好處是修改方便,因為當需要修改句子內(nèi)容時,恰巧已經(jīng)錄過的句子中并沒有這樣的詞語,則還必須請錄音員重錄一次,這不但增加了額外的開支,還由于時間過了較久,錄音員的語調(diào)同原來相比肯定會有些變化,所以原來的錄音只能全部作廢,所有的一切都要從頭開始。

綜上所述,采用計算機來分析組合以及剪輯語音的好處是處理直觀、修改方便,語句連續(xù)性強,合成的句子更具有人性化。

不僅如此,采用該開發(fā)平臺,還可直觀地看出每個語句的詳細信息,包括:開始地址、結(jié)束地址、語句所用時間、語句所占用芯片行的段數(shù)等對使用該語音芯片時碰到的比較敏感的信息。

為此,設(shè)計整個開發(fā)平臺的結(jié)構(gòu)框圖如圖1所示。

優(yōu)化lSD系列語音芯片的開發(fā)平臺設(shè)計方案介紹

系統(tǒng)工作方式如下:首先,通過傳聲器將相關(guān)的大段語句經(jīng)計算機聲卡錄制成為*,way文件并保存,然后借助于語音處理軟件如CoolEdit剪輯出需要的單詞(或短句)并去掉頭尾的空白,將剪輯過的單詞(或短句)每段都單獨另存為新的·.wav文件,并把它們?nèi)糠湃艘粋€單獨目錄。啟動1SD編程燒錄器上位機開發(fā)軟件,選中所有的待錄*.wav文件,并點“開始燒錄”,所有過程將會自動完成。燒錄結(jié)束后會有提示,并且自動記錄一份工作信息表,包括工作時間、語音文件數(shù)、錄音總時間、每一段語音在lSD芯片中的起始地址及結(jié)束地址,其占用時間等。有了這些數(shù)據(jù),就可以較方便地修改甚至對某些地方重新錄制。將錄制過的芯片及各段語音的起始地址表交給其它下位機程序員,他們就可以利用單片機DSP控制器來隨心所欲地開發(fā)相應(yīng)的語音提示設(shè)備了。

4 -F位機軟硬件

下位機硬件應(yīng)包括信號調(diào)理部分和數(shù)據(jù)通信部分,前者將信號電平調(diào)整到lSD芯片允許的最優(yōu)的范圍,后者接收計算機發(fā)來的各種控制信息,如“開始燒錄”信號、“段間停止”信號、“返回結(jié)束地址”信號、“放音試音”信號,通過編程器的微控制器完成所需任務(wù)。

下位機硬件框圖設(shè)計如圖2。

優(yōu)化lSD系列語音芯片的開發(fā)平臺設(shè)計方案介紹

其中MAX232是電平轉(zhuǎn)換芯片,它使計算機通過符合RS232協(xié)議的串口和符合TYL電平的單片機直接通信。準備錄制時,電腦通過串口發(fā)出握手信號給單片機,單片機接到該信號作出響應(yīng),計算機接到該回答后將錄音首地址發(fā)送給單片機,同時放音控件開始放音,信號由音頻線輸入到燒錄器的信號接收端,經(jīng)信號調(diào)整電路接至lSD芯片的錄音管腳。單片機接到首地址后立刻發(fā)控制信息給1SD芯片,通知其開始錄音。這樣,就在上位機的協(xié)調(diào)下語音自動地燒錄到了芯片。當該段語音錄制完畢后,上位機發(fā)語音段結(jié)束信號,同時停止放音,單片機接收到該信號后,停止錄音并讀出結(jié)束地址,將其送回上位機。上位機讀人該地址將其寫入地址表以備查詢。如果還有待錄語音段的話,在上一語段的結(jié)束地址的基礎(chǔ)上加1,作為新一段的開始地址,重復上述過程直至錄音完畢。全部語音錄制完畢后,上位機作出提示,讓你選擇放音按鍵,以測試錄音效果。當按下該鍵時,上位機quot;依次放音“命令給單片機,單片機通知lSD芯片開始放音,ISD通過放音管腳將語音信號輸出,經(jīng)過功放芯片TDA2822M將功率放大后,通過揚聲器發(fā)聲,就可一段段地將剛錄制的語音放出來。如有什么地方不滿意,可通過地址表查出該段首地址,單獨選擇該段語音,將其首地址輸入”起始地址“框,點擊”開始錄音“就可將該段語音重新錄制一遍。

優(yōu)化lSD系列語音芯片的開發(fā)平臺設(shè)計方案介紹

5上位機軟件

語音編輯軟件采用CoolEdit,它包含高品質(zhì)的數(shù)字效果組件,可在任何聲卡上進行64軌混音。上位機運行環(huán)境用可視化的編程軟件Visual C++6.0來開發(fā)。

上位機運行軟件應(yīng)有以下功能

(1)通信功能。因為上位機必須發(fā)控制信號以及起始地址數(shù)據(jù)給下位機,而下位機也要發(fā)應(yīng)答信號及結(jié)束地址數(shù)據(jù)給上位機,故該通信為雙向通信。在此采用MSComm控件。使用串口通信控件進行通信,必須首先對串口進行初始化。初始化后,就可以調(diào)用MSComm控件的SetOutput()和Getlnput()函數(shù)來對串口進行讀寫了,具體的使用方法在微軟的開發(fā)手冊

MSDN中有詳細介紹。

(2)放音控制功能。上位機必須有放音控制功能,以便根據(jù)需要來開始、停止聲卡放音。并且因為需要程序自動地控制,所以要求放音與停止放音能由VC命令語句來編程控制,在此采用CActiveMovie3控件。ActiveMovie不僅是一個播放器,同時也是ActiveX套件中的一個控件,它可以用來播放媒體文件,它支持絕大部分目前通用的媒體格式,它可以播放Wave,Midi,Avi,MPEG,QuickTime Movie等格式文件,甚至還可以用它來看視盤節(jié)目。由于它還是個控件,所以可以在VB或VC的程序中調(diào)用它。對它的操作相當簡單,只需提供要播放的文件名就可以用Run,Pause,Stop方法來播放、暫停和停止該媒體文件。

(3)保存數(shù)據(jù)功能。需要將各種工作信息(尤其是起始地址信息)保存到一個文本文件,以供查詢。保存數(shù)據(jù)比較簡單,直接調(diào)用現(xiàn)有的函數(shù)即可。

6總結(jié)

文中針對當前使用lSD系列語音芯片中存在的問題,提出并設(shè)計了一種開發(fā)ISD系列芯片的平臺,它可方便地對聲音信號進行編輯處理,選好待錄信號后可自動地將這些語音段錄入1SD芯片,燒錄過程中以直觀形式顯示進度,完畢后以文本文件的方式給出每個語音段的起始地址和結(jié)束地址,方便利用該芯片做相應(yīng)的語音提示或其它電路,因此具有較大的實用意義。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    453

    文章

    50254

    瀏覽量

    421133
  • 存儲器
    +關(guān)注

    關(guān)注

    38

    文章

    7440

    瀏覽量

    163530
  • 計算機
    +關(guān)注

    關(guān)注

    19

    文章

    7383

    瀏覽量

    87644
收藏 人收藏

    評論

    相關(guān)推薦

    WTN6040FP-14S語音芯片在電梯控制板中的應(yīng)用開發(fā)方案-實現(xiàn)樓層指引背景音樂播放功能

    環(huán)境,提高運行效率,本文將介紹一種基于WTN6040FP-14S語音芯片的電梯控制板開發(fā)方案。該方案
    的頭像 發(fā)表于 11-12 14:16 ?67次閱讀

    NVH-FLASH語音芯片支持平臺語音—打造音頻IC技術(shù)革新

    與靈活的支持平臺,正逐步引領(lǐng)著音頻設(shè)備向更高品質(zhì)、更智能化方向發(fā)展。一、NVH-FLASH系列語音芯片概述NVH-FLASH系列
    的頭像 發(fā)表于 10-16 08:02 ?142次閱讀
    NVH-FLASH<b class='flag-5'>語音</b><b class='flag-5'>芯片</b>支持<b class='flag-5'>平臺</b>做<b class='flag-5'>語音</b>—打造音頻IC技術(shù)革新

    智能密碼、指紋鎖語音芯片ic方案 可存放40s語音內(nèi)容 NVD語音芯片

    隨著科技的飛速發(fā)展,智能家居安全領(lǐng)域迎來了前所未有的變革。智能密碼與指紋鎖作為現(xiàn)代家庭安全防護的重要一環(huán),其背后的語音芯片IC開發(fā)更是這一變革中的關(guān)鍵技術(shù)突破。智能密碼、指紋鎖語音
    的頭像 發(fā)表于 09-25 08:01 ?228次閱讀
    智能密碼、指紋鎖<b class='flag-5'>語音</b><b class='flag-5'>芯片</b>ic<b class='flag-5'>方案</b> 可存放40s<b class='flag-5'>語音</b>內(nèi)容 NVD<b class='flag-5'>語音</b><b class='flag-5'>芯片</b>

    WTK6900芯片離線風扇語音控制方案,自適應(yīng)降噪|精準識別,靜享科技生活!

    開發(fā)背景在這個智能家居時代,我們重新定義了“清涼”的含義。唯創(chuàng)知音作為智能語音識別領(lǐng)域的領(lǐng)航者,推出搭載WTK6900系列芯片的智能風扇解決方案
    的頭像 發(fā)表于 07-27 08:37 ?297次閱讀
    WTK6900<b class='flag-5'>芯片</b>離線風扇<b class='flag-5'>語音</b>控制<b class='flag-5'>方案</b>,自適應(yīng)降噪|精準識別,靜享科技生活!

    深圳晶鑫微電子:引領(lǐng)智能語音芯片新紀元

    智能語音IC開發(fā),智能語音芯片方案
    的頭像 發(fā)表于 04-28 10:33 ?361次閱讀

    電動車充電語音提示芯片-充電柜OTP語音方案開發(fā)

    語音解決方案:otp智能語音升級方案開發(fā)
    的頭像 發(fā)表于 04-15 10:18 ?460次閱讀

    語音IC-智能語音芯片方案-您身邊的智選升級

    語音IC方案開發(fā)-智能語音升級OTP開發(fā)應(yīng)用場景
    的頭像 發(fā)表于 04-12 17:00 ?431次閱讀

    基于唯創(chuàng)語音芯片的三大煙霧報警器語音方案

    在智能設(shè)備與物聯(lián)網(wǎng)(IoT)技術(shù)的飛速發(fā)展中,語音播報功能的重要性日益凸顯,已成為提升用戶體驗、實現(xiàn)人機交互的關(guān)鍵一環(huán)。本文將深入探討三種創(chuàng)新性語音播報系統(tǒng)設(shè)計方案:傳統(tǒng)方案——獨立的
    的頭像 發(fā)表于 04-12 15:08 ?370次閱讀
    基于唯創(chuàng)<b class='flag-5'>語音</b><b class='flag-5'>芯片</b>的三大煙霧報警器<b class='flag-5'>語音</b><b class='flag-5'>方案</b>

    OTP語音芯片-語音IC智能升級方案

    OTP語音方案開發(fā)
    的頭像 發(fā)表于 04-10 12:40 ?416次閱讀

    WT588F系列語音芯片ic用在閘機通道語音播報上

    語音芯片
    WT-深圳唯創(chuàng)知音電子有限公司
    發(fā)布于 :2023年12月20日 17:50:39

    WTN6xxx系列OTP語音芯片:智能語音解決方案的可靠之選

    在智能語音交互領(lǐng)域,唯創(chuàng)知音的WTN6xxx系列OTP語音芯片以其獨特的特性成為聲音播放提示IC的可靠之選。本文將深入探討WTN6xxx系列
    的頭像 發(fā)表于 12-14 10:12 ?477次閱讀
    WTN6xxx<b class='flag-5'>系列</b>OTP<b class='flag-5'>語音</b><b class='flag-5'>芯片</b>:智能<b class='flag-5'>語音</b>解決<b class='flag-5'>方案</b>的可靠之選

    單片機語音芯片開發(fā)要解決的問題

    單片機語音芯片開發(fā)中,需考慮功耗、語音識別準確率、尺寸和可靠性問題。通過優(yōu)化功耗、采用先進語音
    的頭像 發(fā)表于 11-23 15:19 ?579次閱讀

    OTP語音芯片WTN6系列:多樣化選擇,滿足各種產(chǎn)品應(yīng)用需求

    隨著科技的快速發(fā)展,語音芯片已經(jīng)成為了智能產(chǎn)品中不可或缺的核心組件。在這個領(lǐng)域中,唯創(chuàng)知音OTP語音芯片WTN6系列以其出色的性能和多樣化的
    的頭像 發(fā)表于 11-23 14:28 ?338次閱讀
    OTP<b class='flag-5'>語音</b><b class='flag-5'>芯片</b>WTN6<b class='flag-5'>系列</b>:多樣化選擇,滿足各種產(chǎn)品應(yīng)用需求

    OTP語音芯片WTN6系列:多樣化選擇,滿足各種產(chǎn)品應(yīng)用需求

    隨著科技的快速發(fā)展,語音芯片已經(jīng)成為了智能產(chǎn)品中不可或缺的核心組件。在這個領(lǐng)域中,唯創(chuàng)知音OTP語音芯片WTN6系列以其出色的性能和多樣化的
    的頭像 發(fā)表于 11-23 13:52 ?383次閱讀

    WT588F系列語音芯片應(yīng)用在制氧機語音播報上

    語音芯片語音播報
    WT-深圳唯創(chuàng)知音電子有限公司
    發(fā)布于 :2023年11月22日 17:24:58