基于WT2605C-32N音頻藍(lán)牙語音芯片的實時錄音上傳技術(shù)方案介紹
現(xiàn)代社會,信息技術(shù)的發(fā)展尤其迅速,信息和數(shù)據(jù)的重要性和安全性日漸深刻,在某些特殊場合,因為工作上的需要,或者日常生活的需求,往往需要記錄和保留一些重要的聲音。在某些時刻,錄音成為記錄生活,保存證據(jù)的重要手段,可見,錄音技術(shù)對于我們現(xiàn)代生活尤為重要。
而隨著錄音技術(shù)的發(fā)展,一種實時錄音技術(shù)受到更多人的青睞,相比較于傳統(tǒng)錄音而言,實時錄音技術(shù)突破了設(shè)備的限制,從單純的錄音設(shè)備擴(kuò)展到我們的云端,隨時隨地即可分享,實現(xiàn)了我們錄音數(shù)據(jù)的可交互性,在實際應(yīng)用中給提升了我們產(chǎn)品的應(yīng)用價值,給用戶帶來更完美的體驗感受。
唯創(chuàng)知音一直致力于成為語音物聯(lián)網(wǎng)界的領(lǐng)導(dǎo)者,自主研發(fā)了一種實時錄音技術(shù)上傳技術(shù),在錄音筆,錄音耳機(jī)等錄音設(shè)備上面應(yīng)用廣泛,這種實時錄音技術(shù),具有數(shù)據(jù)量小,失真率低,降噪效果明顯等特點,通過外部藍(lán)牙設(shè)備,即可實現(xiàn)云端存儲,云端即時播放等功能。不僅如此,這種錄音上傳技術(shù)因為其通用性強(qiáng),廣泛應(yīng)用于唯創(chuàng)知音自主研發(fā)的各類藍(lán)牙芯片上,下面我們以其中一種方案作簡單的介紹:
WT2605C-32N錄音上傳方案介紹
1. 方案概述
錄音上傳技術(shù)近些年在錄音筆,錄音耳機(jī)中應(yīng)用廣泛,實現(xiàn)了移動錄音設(shè)備和云端的互聯(lián),即時播放,即時翻譯,同聲傳譯成為產(chǎn)品一大亮點,極大方便了我們的生活。而要保證這些功能的實現(xiàn),就離不開高品質(zhì)的錄音效果,和高壓縮的錄音數(shù)據(jù),本方案錄音采用IMA-ADPCM壓縮算法。IMA-ADPCM (ADPCM Adaptive Differential Pulse Code Modulation), 是一種針對 16bit聲音波形數(shù)據(jù)的一種有損壓縮算法, 它將聲音流中每次采的16bit 數(shù)據(jù)以 4bit 存儲, 所以壓縮比為1:4。而壓縮/解壓縮算法非常的簡單, 所以是一種低空間消耗,高質(zhì)量聲音獲得的好途徑。
2. 方案框圖
本方案采用WT2605C-32N芯片,可外掛本地存儲設(shè)備,通過串口與藍(lán)牙透傳芯片進(jìn)行通信,將錄音數(shù)據(jù)上發(fā)給云端設(shè)備。
3. 方案原理圖
4. 用戶協(xié)議
4.1.協(xié)議命令格式
通訊數(shù)據(jù)格式是:起始位:1位;數(shù)據(jù)位:8位;奇偶位:無;停止位:1位。發(fā)送的指令都為十六進(jìn)制的格式,默認(rèn)波特率為115200,可進(jìn)行修改,但不可小于115200波特率。使用電腦串口調(diào)試助手,需要正確設(shè)置串口的參數(shù),設(shè)置如圖:
注意:“長度”是指長度+命令碼+參數(shù)+校驗和的長度,“累加和校驗”是指長度+命令碼+參數(shù)的累加和的第八位。
4.2.返回碼格式
參數(shù):00 :表示執(zhí)行成功, 開始錄音
01 :表示執(zhí)行錯誤
02 : 表示文件不存在
4.3.命令列表
4.3.1. 錄音開始命令(D6)
APP發(fā)送此條指令,控制錄音芯片開始錄音,此時錄音芯片會返回開始錄音成功返回碼,錄音過程中發(fā)送此條命令返回錯誤;
開始錄音返回碼:
APP收到開始錄音返回碼,則開始準(zhǔn)備處理接收到的錄音數(shù)據(jù),此時芯片進(jìn)入錄音狀態(tài),同時開始發(fā)送錄音數(shù)據(jù)包。
首先錄音芯片會發(fā)送一包60個字節(jié)的音頻數(shù)據(jù)包,該包數(shù)據(jù)為IMA-ADPCM格式音頻數(shù)據(jù)的音頻頭,前面包含“RIFF”標(biāo)志和文件大小,注意此時ChunkSize 為0X00000034不包含當(dāng)前音頻數(shù)據(jù)包的長度,因此整個音頻數(shù)據(jù)包的頭長度為0X08+0X34,也就是60個字節(jié)的長度。客戶需要錄音結(jié)束并接收完整個數(shù)據(jù)包之后,重寫這個位置。
例如,當(dāng)前文件的音頻頭標(biāo)識如下:
接下來的音頻頭包含F(xiàn)ormat Chunk 塊和Fact Chunk,客戶不用關(guān)心實際數(shù)據(jù)情況。
最后的音頻數(shù)據(jù)頭包含Data Chunk 客戶需要錄音結(jié)束并接收完整個數(shù)據(jù)包之后,重寫DataChunkSize這個位置
音頻數(shù)據(jù)頭發(fā)送完畢后,緊接著會發(fā)送音頻數(shù)據(jù)包,按照目前設(shè)置,每個數(shù)據(jù)包C長度為256個字節(jié),受限于每個手機(jī)藍(lán)牙MTU限制,每包數(shù)據(jù)量不能超過手機(jī)默認(rèn)的MTU值,所以這里按照最小MTU值128字節(jié)進(jìn)行配置,將數(shù)據(jù)包C分兩包A+B數(shù)據(jù)包發(fā)送,A和B每包數(shù)據(jù)量為128字節(jié), 每包數(shù)據(jù)的間隔為10MS左右, 每個C包數(shù)據(jù)包間隔為60MS左右(根據(jù)錄音碼率決定,不可更改),即每一個C包數(shù)據(jù)包含整個nBlockAlign ,發(fā)送過程中即使某包數(shù)據(jù)丟失,也不會影響整個文件的播放。
當(dāng)客戶開始接收音頻數(shù)據(jù)包的時候,客戶APP需要記錄錄音結(jié)束前總的音頻數(shù)據(jù)包的個數(shù),比如APP在結(jié)束錄音時候共接收到0X36包音頻數(shù)據(jù)包,則總的音頻數(shù)據(jù)的長度為 0X36 * 0X100 = 0X3600;
4.3.2. 錄音結(jié)束命令(DA)
APP發(fā)送此條指令,錄音芯片接收到錄音結(jié)束命令,停止發(fā)送錄音數(shù)據(jù)包,并結(jié)束當(dāng)前錄音,返回結(jié)束錄音返回碼;
結(jié)束錄音返回碼:
APP收到結(jié)束錄音返回碼,則保存當(dāng)前錄音文件,并將數(shù)據(jù)長度重寫到文件相關(guān)位置,如圖所示。至此,錄音上傳完成。
5. 程序設(shè)計框圖
6. 應(yīng)用實例
下面我們用唯創(chuàng)WT-RS2 APP軟件進(jìn)行實際測試錄音上傳功能,首先打開APP,選擇MP3方案;
連接藍(lán)牙名稱為VT-A782的藍(lán)牙設(shè)備,連接成功后,APP界面默認(rèn)會打印當(dāng)前藍(lán)牙設(shè)備的藍(lán)牙MAC地址,唯創(chuàng)知音可以為每臺藍(lán)牙設(shè)備可以設(shè)置不同的的MAC地址,從而形成單獨唯一的藍(lán)牙名稱,在某些應(yīng)用場合,為每臺產(chǎn)品形成唯一身份碼。
點擊APP界面開始錄音標(biāo)志,此時APP按照時間創(chuàng)建錄音文件,此時開始接收錄音數(shù)據(jù),每個A和B包數(shù)據(jù)間隔10MS,每個C包數(shù)據(jù)間隔60MS,直到點擊APP結(jié)束錄音按鈕,此時APP顯示錄音結(jié)束。此時錄音文件已經(jīng)創(chuàng)建完畢,客戶可通過APP界面將錄音文件通過分享的方式發(fā)送到電腦或者其他播放器進(jìn)行播放!
關(guān)于我們
唯創(chuàng)知音作為一家專注于語音技術(shù)研究的高新技術(shù)企業(yè),始終堅持以“服務(wù)好工程師”為目標(biāo),以行業(yè)語音交互器件標(biāo)準(zhǔn)化為方向,致力于讓復(fù)雜變簡單,提供快捷的語音、智能物聯(lián)網(wǎng)應(yīng)用解決方案。
WT588F02B、WT2003H系列語音芯片應(yīng)用設(shè)計方案,在智能鬧鐘、智能水杯、霧化器等消費電子行業(yè)領(lǐng)域內(nèi)已有成熟的應(yīng)用案例。消費類電子產(chǎn)品應(yīng)用是公司重要的發(fā)展領(lǐng)域,未來,唯創(chuàng)知音將在更多行業(yè)推出標(biāo)準(zhǔn)化語音芯片,進(jìn)一步提升工程師的設(shè)計體驗,為消費類電子行業(yè)標(biāo)準(zhǔn)化賦能。
更多詳情可搜索:深圳唯創(chuàng)知音電子有限公司,與在線客服溝通,我們會發(fā)送一份選型表給到大家,芯片 與 模塊 還可以申請免費送樣服務(wù),期待您的光臨。
-
藍(lán)牙芯片
+關(guān)注
關(guān)注
17文章
365瀏覽量
45823
發(fā)布評論請先 登錄
相關(guān)推薦
評論