0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

智能語(yǔ)音技術(shù)大有可為

MEMS ? 來(lái)源:中國(guó)電子報(bào) ? 作者:中國(guó)電子報(bào) ? 2021-05-24 10:08 ? 次閱讀

說(shuō)到聲音,你會(huì)想到什么?是人講話的聲音、汽車發(fā)動(dòng)機(jī)啟動(dòng)時(shí)發(fā)出的轟鳴聲,還是手指敲擊鍵盤的陣陣窸窣聲?每天縈繞于人耳的聲音其實(shí)是包羅萬(wàn)象的,有關(guān)聲音的學(xué)問(wèn)也與人工智能領(lǐng)域有著密不可分的關(guān)系。

“人耳能聽到的聲音大體上可以為幾種?!北笨迫鹇?a href="http://www.ttokpm.com/v/" target="_blank">科技股份有限公司副總經(jīng)理黃石磊告訴《中國(guó)電子報(bào)》記者,“第一類聲音是人們?nèi)粘Uf(shuō)話的聲音,即語(yǔ)音;第二類是音樂(lè);第三類聲音分別是自然界、城市生產(chǎn)生活中產(chǎn)生的聲音。這三者我們通常也稱為廣義的音頻。”所有的聲音都蘊(yùn)藏著“智慧”的要義,智能系統(tǒng)通過(guò)機(jī)器感知技術(shù)可以實(shí)現(xiàn)聲音采集、識(shí)別和理解等信息處理,也可以利用更加復(fù)雜的技術(shù)進(jìn)行分析,最終實(shí)現(xiàn)人機(jī)對(duì)話、智能判析和決策。作為人工智能產(chǎn)業(yè)鏈的重要細(xì)分領(lǐng)域之一,智能音頻處理也因此有了賦能千行百業(yè)的力量。

智能語(yǔ)音技術(shù)大有可為

現(xiàn)階段,我們正處在一個(gè)信息爆炸的時(shí)代,每個(gè)行業(yè)的發(fā)展都會(huì)產(chǎn)生海量的信息。正是這些浩如煙海的信息,構(gòu)成了非常專業(yè)和復(fù)雜的系統(tǒng)。要想在這個(gè)復(fù)雜的系統(tǒng)下將業(yè)務(wù)流程做到標(biāo)準(zhǔn)化和規(guī)范化,智能語(yǔ)音的應(yīng)用就顯得尤為關(guān)鍵。

“語(yǔ)音是人們一種最自然的交互方式,它有非接觸、可穿透等特性。”北科瑞聲科技股份有限公司總經(jīng)理助理汪雪說(shuō),“基于它的特性,語(yǔ)音是賦能傳統(tǒng)行業(yè)最好的方式之一。”

汪雪表示,智能語(yǔ)音的應(yīng)用十分自然,可以賦能非常多的應(yīng)用場(chǎng)景。在看到智能語(yǔ)音市場(chǎng)中存在的發(fā)展機(jī)遇后,北科瑞聲選擇了智能音頻賽道,專注于人工智能語(yǔ)音音頻信息處理,目前已成為國(guó)內(nèi)擁有全鏈條語(yǔ)音技術(shù)的人工智能企業(yè)。

與國(guó)外的Nuance、谷歌、蘋果、微軟和國(guó)內(nèi)的科大訊飛、百度、小i機(jī)器人等眾多擁有全棧技術(shù)的智能語(yǔ)音企業(yè)不同,北科瑞聲對(duì)垂直領(lǐng)域進(jìn)行了定制化研發(fā),更多專注于與特定行業(yè)結(jié)合的智能語(yǔ)音技術(shù),產(chǎn)品應(yīng)用也面向醫(yī)療、政務(wù)和交通等特定行業(yè)。黃石磊以醫(yī)療行業(yè)為例向記者表示,運(yùn)用智能語(yǔ)音技術(shù)可以讓每位醫(yī)務(wù)工作者都擁有一個(gè)自動(dòng)化語(yǔ)音小助手,這個(gè)語(yǔ)音小助手能夠聽懂他講話,并在必要時(shí)給他提供幫助。

“各行業(yè)業(yè)務(wù)流程的信息化和規(guī)范化會(huì)涉及很多重復(fù)的工作,而通過(guò)智能化的手段可以自動(dòng)完成這些重復(fù)的工作?!秉S石磊對(duì)記者說(shuō),“這能夠大大提升專業(yè)工作人員的效率?!?/p>

例如在醫(yī)療信息化應(yīng)用中,目前北科瑞聲正在布局的醫(yī)療行業(yè)面臨真實(shí)環(huán)境帶來(lái)的難題。黃石磊談道,除了人發(fā)出的聲音以外,周圍環(huán)境的人和各種設(shè)備都會(huì)產(chǎn)生聲音。他表示,當(dāng)這些聲音混在一起,就會(huì)讓人們關(guān)注的聲音難以被處理。“醫(yī)院中的環(huán)境是非常嘈雜的,(在這種情況下進(jìn)行語(yǔ)音處理)其實(shí)是對(duì)現(xiàn)有技術(shù)的一大考驗(yàn)?!秉S石磊說(shuō)。

又比如,當(dāng)前信息化建設(shè)的提速也讓工業(yè)互聯(lián)網(wǎng)屢次成為業(yè)內(nèi)關(guān)注的焦點(diǎn)。在采訪過(guò)程中,黃石磊特別強(qiáng)調(diào)了智能音頻在工業(yè)互聯(lián)網(wǎng)領(lǐng)域的應(yīng)用情況。他表示,工業(yè)互聯(lián)網(wǎng)涉及包括音頻處理在內(nèi)的信號(hào)處理技術(shù),基于語(yǔ)音的人機(jī)交互可以應(yīng)用于人和設(shè)備的交互過(guò)程中,還可以在針對(duì)非語(yǔ)音實(shí)現(xiàn)從智能語(yǔ)音到智能音頻的擴(kuò)展。但是目前,工業(yè)領(lǐng)域是一個(gè)充滿噪聲、混響、回聲等相對(duì)復(fù)雜因素的場(chǎng)景,智能語(yǔ)音、只能音頻技術(shù)在工業(yè)領(lǐng)域的賦能效果尚不明顯,落地場(chǎng)景也有待拓寬。很多企業(yè)礙于高成本和低收益,智能化轉(zhuǎn)型動(dòng)力不足。作為行業(yè)伙伴的賦能者,北科瑞聲將對(duì)該領(lǐng)域進(jìn)行更為深入的布局。

共性挑戰(zhàn)亟待突破

不同的應(yīng)用場(chǎng)景會(huì)產(chǎn)生不同的數(shù)據(jù)和需求,比如在語(yǔ)音識(shí)別等場(chǎng)景中,用戶的需求正在不斷涌現(xiàn)、提升。然而,很多的智能音頻處理產(chǎn)品的應(yīng)用和功能仍具有一定邊界,只能在理想的環(huán)境條件中發(fā)揮作用。

智能音頻處理行業(yè)的發(fā)展一波三折,在整個(gè)行業(yè)的發(fā)展過(guò)程中,深耕垂直領(lǐng)域和特定行業(yè)的北科瑞聲也遇到了很多企業(yè)都在面臨的共性挑戰(zhàn)。在黃石磊看來(lái),第一個(gè)挑戰(zhàn)就來(lái)源于不同行業(yè)間的行業(yè)知識(shí)的壁壘。每一個(gè)行業(yè)都有自己獨(dú)特的符號(hào)體系和術(shù)語(yǔ)體系。對(duì)智能語(yǔ)音產(chǎn)品來(lái)講,要想游刃有余地在不同行業(yè)中理解并識(shí)別各種紛繁復(fù)雜的音頻信息,是比較困難的一件事。“就像人一樣,當(dāng)我們從一個(gè)行業(yè)跑到另一個(gè)行業(yè),我們也會(huì)發(fā)現(xiàn)自己完全聽不懂或者不理解新行業(yè)中的一些術(shù)語(yǔ)?!秉S石磊對(duì)記者說(shuō)。

第二個(gè)挑戰(zhàn)在于目前機(jī)器與人對(duì)語(yǔ)音語(yǔ)言理解的能力差異。黃石磊表示,人類具備抽象表達(dá)的能力,也具備察言觀色的能力。人類的語(yǔ)言會(huì)涉及一些隱含的意思和抽象的表達(dá),但機(jī)器在這些方面還遠(yuǎn)遠(yuǎn)達(dá)不到人類理解能力。

最后一個(gè)挑戰(zhàn)來(lái)自于數(shù)據(jù)的獲取,這也是“先有雞還是先有蛋”的問(wèn)題。黃石磊說(shuō),發(fā)展智能音頻處理行業(yè)需要先獲得語(yǔ)音數(shù)據(jù),但通常只有進(jìn)入到這個(gè)行業(yè)中并得到用戶認(rèn)可后才能獲得數(shù)據(jù)。“理想情況下,還是應(yīng)該先獲得數(shù)據(jù)?!彼f(shuō),“從商業(yè)模式和技術(shù)的角度來(lái)看,(數(shù)據(jù)的獲取)是一個(gè)挑戰(zhàn)?!?/p>

針對(duì)如何克服這些困難,黃石磊也給出了自己的建議。他認(rèn)為,從公司的角度來(lái)講,還是應(yīng)該專注于核心技術(shù)的研發(fā),比如在核心技術(shù)能力方面提供一些具體的產(chǎn)品形態(tài)。此外,他還特別提到要找一些已經(jīng)在行業(yè)深耕的合作伙伴,進(jìn)行協(xié)同發(fā)展。

就像站在巨人的肩膀上可以看得更遠(yuǎn),與合作伙伴的配合也可以加速公司對(duì)智能音頻對(duì)各個(gè)行業(yè)的理解。由于在整個(gè)行業(yè)中扮演的是一個(gè)“被集成者”的角色,北科瑞聲在尋找行業(yè)合作伙伴時(shí)相對(duì)而言更具優(yōu)勢(shì)。黃石磊表示,合作伙伴在某些領(lǐng)域有一定技術(shù)和客戶基礎(chǔ),公司可以借助合作伙伴已有的基礎(chǔ),更快地融入到行業(yè)中去,為行業(yè)客戶提升價(jià)值,最終實(shí)現(xiàn)行業(yè)客戶、行業(yè)產(chǎn)品提供方和公司的三方共贏。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 自動(dòng)化
    +關(guān)注

    關(guān)注

    28

    文章

    5386

    瀏覽量

    78634
  • 人工智能
    +關(guān)注

    關(guān)注

    1787

    文章

    46061

    瀏覽量

    235023
  • 智能語(yǔ)音
    +關(guān)注

    關(guān)注

    10

    文章

    771

    瀏覽量

    48595

原文標(biāo)題:北科瑞聲:智能音頻提升空間巨大

文章出處:【微信號(hào):MEMSensor,微信公眾號(hào):MEMS】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    氫能源車加速放量,AEM制氫大有可為!

    制加氫一體站將是支撐氫能交通發(fā)展的基石,伴隨著站點(diǎn)普及,AEM制氫大有可為
    的頭像 發(fā)表于 08-27 09:51 ?181次閱讀
    氫能源車加速放量,AEM制氫<b class='flag-5'>大有可為</b>!

    STM32如何詮釋電機(jī)控制創(chuàng)新 如何更高效更智能

    為了提高電機(jī)系統(tǒng)的效率,電機(jī)控制技術(shù)大有可為。通過(guò)采用性能更高、集成度更高的半導(dǎo)體器件,功能強(qiáng)大且安全的微控制器,更智能的傳感器,結(jié)合更優(yōu)化的軟件算法,可實(shí)現(xiàn)提升效率、降低損耗的目的。
    發(fā)表于 06-06 10:44 ?596次閱讀
    STM32如何詮釋電機(jī)控制創(chuàng)新 如何更高效更<b class='flag-5'>智能</b>

    DLP技術(shù)智能家居中大有可為

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃山明)DLP技術(shù)自發(fā)明以來(lái),經(jīng)歷了實(shí)驗(yàn)室研究、原型開發(fā)、商業(yè)化應(yīng)用以及持續(xù)的技術(shù)創(chuàng)新和市場(chǎng)擴(kuò)張,成為現(xiàn)代投影和顯示行業(yè)中不可或缺的關(guān)鍵技術(shù)之一,尤其在智能家居領(lǐng)
    的頭像 發(fā)表于 03-31 13:28 ?3381次閱讀
    DLP<b class='flag-5'>技術(shù)</b>在<b class='flag-5'>智能家居中大有可為</b>

    薩科微總經(jīng)理宋仕強(qiáng):華強(qiáng)北貿(mào)易商來(lái)賣國(guó)產(chǎn)品牌大有可為

    薩科微總經(jīng)理宋仕強(qiáng)說(shuō),華強(qiáng)北貿(mào)易商來(lái)賣國(guó)產(chǎn)品牌大有可為,他們本身有這些優(yōu)勢(shì)A. 熟悉華強(qiáng)北電子市場(chǎng)和電子信息產(chǎn)品B. 客情關(guān)系好,和終端客戶和市場(chǎng)客戶有深度的交流和交情,C .為客戶服務(wù)的商務(wù)方式多
    發(fā)表于 03-22 09:47

    車內(nèi)語(yǔ)音識(shí)別技術(shù)智能駕駛中的應(yīng)用與前景

    一、引言 隨著智能駕駛技術(shù)的快速發(fā)展,車內(nèi)語(yǔ)音識(shí)別技術(shù)逐漸成為智能駕駛領(lǐng)域的研究熱點(diǎn)。語(yǔ)音識(shí)別
    的頭像 發(fā)表于 02-19 11:46 ?622次閱讀

    這些傳感器,大有可為

    來(lái)源:半導(dǎo)體行業(yè)觀察,謝謝 編輯:感知芯視界 Link 近年來(lái),人們對(duì)健康和環(huán)境的認(rèn)識(shí)不斷提高。多款空氣質(zhì)量監(jiān)測(cè)儀已經(jīng)開發(fā)出來(lái),幫助氣體和顆粒傳感器市場(chǎng)在 2023 年至 2029 年間分別增長(zhǎng) 8% 和 11%,到 2029 年市場(chǎng)總規(guī)模將達(dá)到 28 億美元。對(duì)于數(shù)字嗅覺(jué),該領(lǐng)域仍然由用于研發(fā)項(xiàng)目和服務(wù)的銷售產(chǎn)品;我們預(yù)計(jì) 2029 年將達(dá)到 5200 萬(wàn)美元。 首先,就氣體傳感收入而言,工業(yè)是最大的市場(chǎng),其次是顆粒物傳感器。主要驅(qū)動(dòng)因素是 HVAC 和 AC 系統(tǒng)以及建筑物
    的頭像 發(fā)表于 02-18 10:59 ?260次閱讀

    金航標(biāo)kinghelm薩科微slkor

    金航標(biāo)kinghelm(www.kinghelm.net)薩科微slkor(www.slkormicro.com)CEO宋仕強(qiáng)說(shuō),本土的功率器件在國(guó)產(chǎn)替代市場(chǎng)還是大有可為的,新潔能、華虹、華潤(rùn)、士蘭
    發(fā)表于 02-02 09:52

    語(yǔ)音數(shù)據(jù)集:智能語(yǔ)音技術(shù)的燃料與推動(dòng)力

    隨著人工智能技術(shù)的不斷進(jìn)步,語(yǔ)音技術(shù)作為人機(jī)交互的重要方式,正在逐漸滲透到我們的日常生活中。而語(yǔ)音數(shù)據(jù)集作為智能
    的頭像 發(fā)表于 12-29 11:11 ?306次閱讀

    語(yǔ)音數(shù)據(jù)集:開啟智能語(yǔ)音技術(shù)的新篇章

    隨著人工智能技術(shù)的飛速發(fā)展,語(yǔ)音數(shù)據(jù)集在推動(dòng)智能語(yǔ)音技術(shù)的進(jìn)步中發(fā)揮著越來(lái)越重要的作用。語(yǔ)音數(shù)據(jù)
    的頭像 發(fā)表于 12-29 11:06 ?461次閱讀

    語(yǔ)音數(shù)據(jù)集:推動(dòng)智能語(yǔ)音技術(shù)發(fā)展的關(guān)鍵驅(qū)動(dòng)力

    隨著人工智能技術(shù)的不斷進(jìn)步,智能語(yǔ)音技術(shù)已經(jīng)成為我們?nèi)粘I钪胁豢苫蛉钡囊徊糠帧?b class='flag-5'>語(yǔ)音數(shù)據(jù)集作為智能
    的頭像 發(fā)表于 12-28 13:46 ?406次閱讀

    離線語(yǔ)音識(shí)別及控制是怎樣的技術(shù)?

    引言:  隨著人工智能的飛速發(fā)展,離線語(yǔ)音識(shí)別技術(shù)成為了一項(xiàng)備受矚目的創(chuàng)新。離線語(yǔ)音識(shí)別技術(shù)能夠?qū)⑷说?b class='flag-5'>語(yǔ)
    發(fā)表于 11-24 17:41

    希捷:構(gòu)建數(shù)智未來(lái),存儲(chǔ)大有可為

    供的覆蓋邊緣、云端等一系列存儲(chǔ)解決方案以及前沿技術(shù),并且開啟了以“構(gòu)建數(shù)智未來(lái),存儲(chǔ)大有可為”為主題的發(fā)布。希捷亮相第十九屆中國(guó)國(guó)際社會(huì)公共安全博覽會(huì)希捷CPSE展臺(tái):構(gòu)建數(shù)智未來(lái),存儲(chǔ)大有可為
    的頭像 發(fā)表于 10-26 09:42 ?526次閱讀
    希捷:構(gòu)建數(shù)智未來(lái),存儲(chǔ)<b class='flag-5'>大有可為</b>

    語(yǔ)音識(shí)別技術(shù)智能客服領(lǐng)域的應(yīng)用與挑戰(zhàn)

    一、引言 隨著人工智能技術(shù)的不斷發(fā)展,智能客服成為了許多行業(yè)的重要應(yīng)用。語(yǔ)音識(shí)別技術(shù)作為智能客服的重要組成部分,對(duì)于提高客戶滿意度和提升企業(yè)
    的頭像 發(fā)表于 10-25 10:37 ?544次閱讀

    三大更新即將發(fā)布,藍(lán)牙技術(shù)大有可為

    ? 電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)近段時(shí)間,關(guān)于藍(lán)牙、星閃技術(shù)和UWB之間的討論非常熱烈,有時(shí)候范圍還會(huì)擴(kuò)展到Wi-Fi,一時(shí)間藍(lán)牙的處境看上去有些四面楚歌。不過(guò),在“藍(lán)牙誕生25周年:致力于建立
    的頭像 發(fā)表于 10-23 08:16 ?1531次閱讀
    三大更新即將發(fā)布,藍(lán)牙<b class='flag-5'>技術(shù)</b>仍<b class='flag-5'>大有可為</b>

    晶能光電:硅襯底GaN材料應(yīng)用大有可為

    硅襯底GaN材料在中低功率的高頻HEMT和LED專業(yè)照明領(lǐng)域已經(jīng)實(shí)現(xiàn)規(guī)模商用?;诠枰r底GaN材料的Micro LED微顯技術(shù)和低功率PA正在進(jìn)行工程化開發(fā)。DUV LED、GaN LD以及GaN/CMOS集成架構(gòu)尚處于早期研究階段。
    的頭像 發(fā)表于 10-13 16:02 ?586次閱讀
    晶能光電:硅襯底GaN材料應(yīng)用<b class='flag-5'>大有可為</b>