人工智能(AI)和機(jī)器學(xué)習(xí)(ML)將通過將其整合到自動駕駛汽車設(shè)計(jì)中,在汽車行業(yè)的巨大轉(zhuǎn)型中占據(jù)關(guān)鍵地位。與供應(yīng)鏈管理、制造運(yùn)營、移動服務(wù)、圖像和視頻分析等其他領(lǐng)域一起,音頻分析在自動駕駛汽車取得成功方面發(fā)揮著重要作用。隨著技術(shù)的進(jìn)步和創(chuàng)新,汽車行業(yè)正在重塑和采用新技術(shù)。音頻分析極大地改變了汽車公司對其產(chǎn)品的關(guān)注,以提高客戶滿意度。到2030年,自動駕駛汽車的全球市場規(guī)模將增長到600億美元。
無人駕駛汽車機(jī)器學(xué)習(xí)下的音頻分析包括音頻分類、NLP、語音/語音和聲音識別。語音和語音識別已成為自動駕駛汽車和汽車行業(yè)不可或缺的一部分。在以前的汽車模型中,語音和語音識別是一個挑戰(zhàn),因?yàn)槿狈Ω咝У?a href="http://ttokpm.com/v/tag/2562/" target="_blank">算法、可靠的連接和邊緣的處理能力。此外,車內(nèi)機(jī)艙噪音降低了音頻分析的性能,從而導(dǎo)致錯誤識別。
長期以來,機(jī)器中的音頻分析一直是不斷研究的主題。隨著技術(shù)的進(jìn)步,市場上的新產(chǎn)品,如亞馬遜的Alexa和蘋果的Siri,利用了云技術(shù)的關(guān)鍵優(yōu)勢,而這些優(yōu)勢是其他識別系統(tǒng)以前所缺乏的。然而,為了使這些系統(tǒng)在自動駕駛汽車中順利運(yùn)行,將需要不間斷的無線互聯(lián)網(wǎng)服務(wù)。
最近,各種機(jī)器學(xué)習(xí)算法,如kNN(K最近鄰),SVM(支持向量機(jī)),EBT(集成袋樹),深度神經(jīng)網(wǎng)絡(luò)(DNN)和自然語言處理(NLP)廣泛用于音頻分析。
正在從原始音頻中提取各種音頻特征,并將其作為輸入提供給機(jī)器學(xué)習(xí)或深度學(xué)習(xí)算法。
對于音頻分析,音頻數(shù)據(jù)經(jīng)過預(yù)處理以消除噪聲,然后從音頻數(shù)據(jù)中提取音頻特征。此處使用了諸如MFCC(梅爾頻率倒譜系數(shù))之類的音頻特征以及諸如峰度,方差之類的統(tǒng)計(jì)特征。MFCC的頻段在Mel量表上等距,非常接近人類聽覺系統(tǒng)的響應(yīng)。出于同樣的原因,使用此功能訓(xùn)練模型。最后,使用經(jīng)過訓(xùn)練的模型進(jìn)行推理,從安裝在汽車中的多個麥克風(fēng)中獲取實(shí)時(shí)音頻流,然后對其進(jìn)行預(yù)處理并提取特征。提取的特征將被傳遞給訓(xùn)練好的模型,以便正確識別音頻,這對于在自動駕駛汽車中做出正確的決定很有用。
有了新技術(shù),最終用戶的信任是關(guān)鍵點(diǎn),NLP是建立自動駕駛汽車信任的游戲規(guī)則改變者。NLP允許乘客使用語音命令控制汽車,例如要求在餐廳停車,改變路線,在最近的購物中心停車,打開/關(guān)閉燈,打開和關(guān)閉車門等等。這使得乘客體驗(yàn)豐富且互動。
讓我們看看使用音頻分析為自動駕駛汽車開發(fā)的幾個用例
緊急警報(bào)器檢測
任何緊急車輛(如救護(hù)車、消防車或警車)的警笛聲都可以使用各種深度學(xué)習(xí)模型以及 SVM(支持向量機(jī))等機(jī)器學(xué)習(xí)模型來檢測。監(jiān)督學(xué)習(xí)模型 – SVM 用于分類和回歸分析。SVM分類模型使用緊急警報(bào)聲和非緊急聲音的海量數(shù)據(jù)進(jìn)行訓(xùn)練。通過該模型,開發(fā)了識別警報(bào)器聲音的系統(tǒng),以便為自動駕駛汽車做出適當(dāng)?shù)臎Q策,以避免任何危險(xiǎn)情況。有了這個檢測系統(tǒng),自動駕駛汽車可以做出靠邊停車的決定,并為緊急車輛通過提供道路。
發(fā)動機(jī)聲音異常檢測
自動早期檢測可能的發(fā)動機(jī)故障可能是自動駕駛汽車的基本功能。汽車發(fā)動機(jī)在正常情況下工作時(shí)會發(fā)出一定的聲音,當(dāng)出現(xiàn)一些問題/故障時(shí)會發(fā)出不同的聲音。K-means聚類中可用的許多機(jī)器學(xué)習(xí)算法可用于檢測發(fā)動機(jī)聲音中的異常。在 k 均值聚類中,聲音的每個數(shù)據(jù)點(diǎn)都分配給 k 組聚類。數(shù)據(jù)點(diǎn)的分配基于接近該聚類質(zhì)心的平均值。在引擎聲音異常的情況下,數(shù)據(jù)點(diǎn)將落在正常群集之外,并且將成為異常群集的一部分。使用此模型,可以持續(xù)監(jiān)控發(fā)動機(jī)的健康狀況,如果出現(xiàn)任何異常聲音事件,那么自動駕駛汽車可以警告用戶并幫助做出正確的決策以避免任何危險(xiǎn)情況。這可以避免發(fā)動機(jī)完全故障/故障。
按喇叭時(shí)變道
為了使自動駕駛汽車完全像人類駕駛的汽車一樣工作,它必須在以下情況下有效工作:當(dāng)后面的車輛需要緊急通過并按喇叭指示時(shí),必須改變車道。隨機(jī)森林,機(jī)器學(xué)習(xí)算法將最適合這種類型的分類問題。它是一種監(jiān)督分類算法。顧名思義,它將創(chuàng)建決策樹森林,并最終合并所有決策樹以獲得準(zhǔn)確的分類??梢允褂迷撃P烷_發(fā)一個系統(tǒng),該系統(tǒng)將識別喇叭的特定模式并做出相應(yīng)的決定。
自動駕駛汽車的車內(nèi)交互
NLP(自然語言處理)處理人類語言以提取有助于做出決策的含義。乘員不僅可以發(fā)出命令,還可以與自動駕駛汽車交談。假設(shè)你給你的自動駕駛汽車分配了一個像Adriana這樣的名字,那么你就可以對你的車說“Adriana,帶我去我最喜歡的咖啡店”。這仍然是一個簡單的句子,但我們也可以讓自動駕駛汽車?yán)斫飧鼜?fù)雜的句子,例如“帶我去我最喜歡的咖啡店,在到達(dá)那里之前,在吉姆的家里停下來接他”。您可以在車內(nèi)與更多東西互動。但是,自動駕駛汽車不應(yīng)盲目聽從車主的指示,以避免任何危險(xiǎn)情況,例如死亡和生境。為了做到這一點(diǎn),自動駕駛汽車需要一個更強(qiáng)大的NLP,它實(shí)際上可以解釋人類所告訴的內(nèi)容,并且可以回響其后果。
因此,基于機(jī)器學(xué)習(xí)的音頻分析歸因于安全可靠的自動駕駛汽車的日益普及。在 VOLANSYS,我們幫助汽車開發(fā)基于 ML 技術(shù)的定制解決方案,如音頻分析、NLP、語音識別等,從而增強(qiáng)乘客體驗(yàn)、道路安全和及時(shí)的汽車發(fā)動機(jī)維護(hù)。我們的機(jī)器學(xué)習(xí)專家擁有使用高效框架、數(shù)據(jù)分析和可視化工具處理從數(shù)字、音頻、文本、視頻到圖像等多種形式的數(shù)據(jù)的技能。
審核編輯:郭婷
-
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8353瀏覽量
132315 -
自動駕駛
+關(guān)注
關(guān)注
782文章
13624瀏覽量
165959 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5466瀏覽量
120891
發(fā)布評論請先 登錄
相關(guān)推薦
評論