本章非常實(shí)用,所以內(nèi)容較多,這也是從理論走向?qū)嵺`的必經(jīng)之路。離開(kāi)了數(shù)據(jù),你怎么進(jìn)行實(shí)踐操作?在計(jì)算機(jī)中,數(shù)據(jù)的形式就是文件!
五個(gè)部分!
每個(gè)部分都涉及一種常用的文件!
先來(lái)看常用的音頻文件!
大家都愛(ài)聽(tīng)音樂(lè)的吧!現(xiàn)在的耳機(jī)已經(jīng)都是無(wú)線耳機(jī)了,我們?cè)缒甓际怯糜芯€耳機(jī),這一切的變化都要?dú)w功于通信技術(shù)和芯片技術(shù)的發(fā)展?。∥覀?a target="_blank">電子專(zhuān)業(yè)、通信專(zhuān)業(yè)的學(xué)生學(xué)的就是這個(gè)技術(shù)!自豪吧?當(dāng)然了!學(xué)好了就在這個(gè)領(lǐng)域好好發(fā)展,貢獻(xiàn)力量吧!數(shù)字世界的未來(lái)需要大家的參與!
音頻文件也有多種格式!
目前,WAV格式比較常用!
什么是采樣率?
這些知識(shí)都和數(shù)字信號(hào)處理有關(guān)聯(lián)!
大家在大三就要學(xué)這門(mén)課了!
注意:因?yàn)?MATLAB 版本的更新問(wèn)題,在2020a及以后版本中,原函數(shù)wavread( ) 要換成函數(shù) audioread( ) 。
兩函數(shù)的調(diào)用格式存在差別,可以在 MATLAB 命令窗口輸入 help audioread ,可以了解區(qū)別。學(xué)會(huì)使用help是掌握MATLAB的必由路徑。
如果在文件里面加入噪聲,那么聽(tīng)起來(lái)會(huì)有什么變化呢?噪聲怎么加?randn函數(shù)就可模擬噪聲!
為什么講音頻文件?
音頻信號(hào)處理是研究用數(shù)字信號(hào)處理技術(shù)和語(yǔ)音學(xué)知識(shí)對(duì)語(yǔ)音信號(hào)進(jìn)行處理的新興的學(xué)科,是目前發(fā)展最為迅速的信息科學(xué)研究領(lǐng)域的核心技術(shù)之一。通過(guò)聲音傳遞信息是人類(lèi)最重要、最有效、最常用和最方便的交換信息形式。同時(shí),聲音也是人與機(jī)器之間進(jìn)行通信的重要工具,它是一種理想的人機(jī)通信方式,因而可為信息處理系統(tǒng)建立良好的人機(jī)交互環(huán)境,進(jìn)一步推動(dòng)計(jì)算機(jī)和其他智能機(jī)器的應(yīng)用,提高社會(huì)的信息化程度。
語(yǔ)音信號(hào)是基于時(shí)間軸上的一維數(shù)字信號(hào),在這里主要是對(duì)語(yǔ)音信號(hào)進(jìn)行頻域上的分析。在信號(hào)分析中,頻域往往包含了更多的信息。對(duì)于頻域來(lái)說(shuō),大概有8種波形可以讓我們分析:矩形方波,鋸齒波,梯形波,臨界阻尼指數(shù)脈沖波形,三角波,余旋波,余旋平方波,高斯波。對(duì)于各種波形,我們可以用傅立葉變換進(jìn)行分析,就是將時(shí)域的波形轉(zhuǎn)化到頻域結(jié)果。
語(yǔ)音信號(hào)處理是一門(mén)新興的學(xué)科,同時(shí)又是綜合性的多學(xué)科領(lǐng)域和涉及面很廣的交叉學(xué)科。雖然從事這一領(lǐng)域研究的人員主要來(lái)自信號(hào)與信息處理及計(jì)算機(jī)應(yīng)用等學(xué)科,但是它與語(yǔ)音學(xué)、語(yǔ)言學(xué)、聲學(xué)、認(rèn)知科學(xué)、生理學(xué)、心理學(xué)等許多學(xué)科也有非常密切的聯(lián)系。
在上個(gè)世紀(jì)60年代,計(jì)算機(jī)的廣泛應(yīng)用推動(dòng)了語(yǔ)音識(shí)別技術(shù)的發(fā)展,出現(xiàn)了多種語(yǔ)音信號(hào)分析方法,提出了動(dòng)態(tài)規(guī)劃(DP)和線性預(yù)測(cè)分析(LP)技術(shù)。其中后者較好地解決了語(yǔ)音信號(hào)產(chǎn)生模型的問(wèn)題,對(duì)語(yǔ)音識(shí)別的發(fā)展產(chǎn)生了深遠(yuǎn)影響。70年代,語(yǔ)音識(shí)別理論取得了突破。LP技術(shù)得到進(jìn)一步發(fā)展,動(dòng)態(tài)時(shí)間歸正技術(shù)(DTW)基本成熟,特別是提出了矢量量化(VQ)和隱馬爾可夫模型(HMM)理論。在實(shí)踐上,實(shí)現(xiàn)了基于線性預(yù)測(cè)倒譜和DTW技術(shù)的特定人孤立語(yǔ)音識(shí)別系統(tǒng)。80年代,HMM模型和人工神經(jīng)元網(wǎng)絡(luò)(ANN)成功應(yīng)用于實(shí)踐,并于1988年由CMU研制出了非特定人、大詞匯量、連續(xù)語(yǔ)音識(shí)別系統(tǒng)。它可以理解由1000個(gè)單詞構(gòu)成的4200個(gè)句子,被認(rèn)為是語(yǔ)音識(shí)別歷史上的一個(gè)里程碑。HMM模型的廣泛應(yīng)用應(yīng)歸功于AT&T Bell實(shí)驗(yàn)室Rabiner等科學(xué)家的努力,他們把原本晦澀難懂的HMM純數(shù)學(xué)模型工程化,從而為更多研究者了解和認(rèn)識(shí)。ANN和HMM模型建立的語(yǔ)音識(shí)別系統(tǒng),性能相當(dāng)。進(jìn)入90年代,隨著多媒體時(shí)代的來(lái)臨,迫切要求語(yǔ)音識(shí)別系統(tǒng)從實(shí)驗(yàn)室走向?qū)嵱谩,F(xiàn)在,人工智能語(yǔ)音系統(tǒng)已經(jīng)進(jìn)入了社會(huì)的方方面面!
建議大家做一下這樣的測(cè)試!
對(duì)音頻信號(hào)進(jìn)行采集,然后使用MATLAB中的wavread函數(shù)對(duì)音頻文件進(jìn)行信號(hào)讀取,并使用sound函數(shù)對(duì)信號(hào)進(jìn)行播放,重點(diǎn)用于和對(duì)其添加噪聲后的新信號(hào)進(jìn)行對(duì)比。如何添加噪聲?對(duì)音頻文件讀取出的信號(hào)進(jìn)行加噪聲處理。使用matlab中的相關(guān)命令。比如WGN、 AWGN。WGN用于產(chǎn)生高斯白噪聲,AWGN則用于在某一信號(hào)中加入高斯白噪聲,也可直接用randn函數(shù)產(chǎn)生高斯分布序列。
擴(kuò)展知識(shí)面!
在MATLAB中,有哪些音頻處理方法呢?
-
音頻分析
在對(duì)音頻信號(hào)進(jìn)行處理之前,需要先對(duì)音頻信號(hào)進(jìn)行分析。音頻分析的目的是了解音頻信號(hào)的性質(zhì),如幅頻特性(即信號(hào)在不同頻段上信號(hào)的強(qiáng)度變化)和譜密度等。常用的音頻分析方法有:
(1)時(shí)域分析:使用時(shí)域分析方法可以獲得信號(hào)的波形特性,如聲音的語(yǔ)調(diào)和節(jié)奏等。這種方法通常直接分析音頻信號(hào)的時(shí)間屬性,例如音頻信號(hào)的波形、功率、能量以及峰值等。
(2)頻域分析:使用頻域分析方法可以獲得音頻信號(hào)的頻域特性,如頻率成分、譜密度和頻率響應(yīng)等,這些都有助于了解音頻信號(hào)的特征。
-
音頻信號(hào)濾波
音頻信號(hào)濾波是指使用濾波器對(duì)音頻信號(hào)進(jìn)行處理,以去除噪音、增強(qiáng)信號(hào)、調(diào)整頻率響應(yīng)等。
主要有以下幾種濾波方式:
(1)低通濾波器:通常是用于去除高頻噪聲,保留低頻信號(hào),也可以被用來(lái)過(guò)濾高頻隨機(jī)振動(dòng),并平滑低頻的形狀。
(2)高通濾波器:通常是用于去除低頻噪聲,保留高頻信號(hào),也可以用來(lái)過(guò)濾低頻隨機(jī)振動(dòng),而保留高頻的形狀。
(3)帶通濾波器:用于去除不良頻段信號(hào),并提取出希望得到的通帶內(nèi)的信號(hào)。
(4)帶阻濾波器:也稱(chēng)為不僅通濾波器,用于去除在不希望得到的通帶內(nèi)信號(hào),并弱化不良頻段的信號(hào)。
-
音樂(lè)合成
音樂(lè)合成可以通過(guò)各種方式來(lái)實(shí)現(xiàn),在MATLAB中主要使用合成器、算法來(lái)進(jìn)行音樂(lè)合成。
(1)音色合成:可以使用不同類(lèi)型的信號(hào)(例如正弦信號(hào)、方波、sinc函數(shù)等),然后用它來(lái)重構(gòu)所需的聲音,并混合必要的頻譜(頻率成)分)。
(2)波場(chǎng)合成:將多個(gè)聲波波形混合成單個(gè)波開(kāi)形,通過(guò)加性混合器可以將多個(gè)聲波波形添加在一起,形成單個(gè)混合的波形。
-
音頻信號(hào)壓縮
音頻信號(hào)壓縮是音頻處理過(guò)程中必不可少的過(guò)程之一,它可以減小音頻文件的大小,并增加存儲(chǔ)空間的利用率。在MATLAB中,音頻信號(hào)壓縮可以通過(guò)以下幾種方式來(lái)實(shí)現(xiàn):
(1)動(dòng)態(tài)范圍壓縮(Dynamic Range CompressionDRC):用于減小音頻信號(hào)的動(dòng)態(tài)范圍,提高信號(hào)的平均功率,并使音頻信號(hào)更具吸引力和響亮。
(2)均衡器(Equalizer,EQ):用于增強(qiáng)或減弱音頻信號(hào)的各個(gè)頻率段。這通常是通過(guò)使用濾波器來(lái)實(shí)現(xiàn)的。
(3)無(wú)損壓縮:無(wú)損壓縮可以保留音頻信號(hào)的所有信息,以最小化文件存儲(chǔ)空間。
-
音頻降噪
音頻降噪是一種通過(guò)降低噪音水平來(lái)提高聽(tīng)音體驗(yàn)的技術(shù)。常見(jiàn)的音頻降噪技術(shù)有基于時(shí)間的降噪與基于頻率的降噪兩種。在MATLAB中,可以使用以下工具箱和方法來(lái)實(shí)現(xiàn)音頻降噪。
(1)自適應(yīng)降噪器(Adaptive Noise CancellingANC):自適應(yīng)降噪器通過(guò)對(duì)錄制的音頻數(shù)據(jù)進(jìn)行過(guò)濾,消除來(lái)自環(huán)境噪音和雜音的干擾信號(hào)。
(2)波形補(bǔ)償技術(shù)(Waveform Synthesis):波形補(bǔ)償技術(shù)利用反饋控制方式,將零輸出與期望輸出進(jìn)行比較,校準(zhǔn)信號(hào)輸出,外部干擾可以自動(dòng)補(bǔ)償或者消除。
(3)經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)、小波降噪技術(shù)(Wavelet Denoising)除噪:這兩種方法可以用數(shù)學(xué)和數(shù)字信號(hào)處理來(lái)區(qū)分音頻信號(hào)特征中的噪聲和信號(hào),然后消除噪聲信號(hào),降低雜音的影響。
這么多內(nèi)容?是的,什時(shí)候才能開(kāi)始寫(xiě)這方面的程序呢?等學(xué)了《信號(hào)與系統(tǒng)》、《數(shù)字信號(hào)處理》就可以開(kāi)始了!到時(shí)候,大家有興趣,可以找我來(lái)指導(dǎo)!
回顧一下函數(shù)的內(nèi)容!
這是一個(gè)系列視頻!既帶著大家擴(kuò)展思維,也帶著大家深入學(xué)習(xí)函數(shù)!歡迎大家在視頻下面留言評(píng)論!教學(xué)相長(zhǎng)!思維引導(dǎo)的內(nèi)容會(huì)讓你大開(kāi)眼界!這是第一天的講解!
未完,待續(xù)!
修訂記錄
20230208 完成初稿;
20230826修訂內(nèi)容v2;
原文標(biāo)題:MATLAB課程之第五章v2 文件操作(1)
文章出處:【微信公眾號(hào):通信工程師專(zhuān)輯】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
-
通信網(wǎng)絡(luò)
+關(guān)注
關(guān)注
21文章
2025瀏覽量
51928
原文標(biāo)題:MATLAB課程之第五章v2 文件操作(1)
文章出處:【微信號(hào):gh_30373fc74387,微信公眾號(hào):通信工程師專(zhuān)輯】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論