0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

國(guó)內(nèi)最值得關(guān)注的10家人工智能語(yǔ)音識(shí)別公司

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:Carol Li ? 2018-12-29 15:28 ? 次閱讀

在談人工智能的時(shí)候,一定不能不談語(yǔ)音識(shí)別,語(yǔ)音識(shí)別是人機(jī)交互的入口,是指機(jī)器/程序接收、解釋聲音,或理解和執(zhí)行口頭命令的能力。目前國(guó)內(nèi)外都有公司在語(yǔ)音領(lǐng)域有所投入,其中包括才成立幾年的初創(chuàng)企業(yè),也包括中途入局的巨頭企業(yè),電子發(fā)燒友梳理了國(guó)內(nèi)10家在語(yǔ)音領(lǐng)域影響較大的企業(yè)如下,排名不分先后,如有任何紕漏,歡迎留言指正。

科大訊飛

成立于1999年,具有語(yǔ)音合成、語(yǔ)音識(shí)別、口語(yǔ)評(píng)測(cè)、語(yǔ)言翻譯、聲紋識(shí)別、人臉識(shí)別、自然語(yǔ)言處理等智能語(yǔ)音與人工智能核心技術(shù)。

主要產(chǎn)品介紹:

訊飛輸入法,支持語(yǔ)音輸入;

咪咕靈犀,中國(guó)移動(dòng)和科大訊飛聯(lián)合推出的智能語(yǔ)音助手,支持粵語(yǔ),既能語(yǔ)音打電話、發(fā)短信、查天氣、搜航班,還能查話費(fèi)、查流量、買彩票、訂彩鈴等;

發(fā)條,一款基于科大訊飛AIUI智能引擎,通過語(yǔ)音交互,迅速定位用戶想要內(nèi)容的AI音樂助手;

訊飛電視助手,可以語(yǔ)音播放、換臺(tái);

思必馳

成立于2007年,一家專注于智能硬件領(lǐng)域的語(yǔ)音公司,主要面向智能硬件三個(gè)垂直領(lǐng)域:智能車載、智能家居和智能機(jī)器人,提供自然語(yǔ)言交互解決方案。2018年6月26日,宣布完成D輪5億元融資。

主要產(chǎn)品介紹:

對(duì)話操作系統(tǒng)AIOS系統(tǒng)(AISpeechOperatingSystem思必馳人工智能操作系統(tǒng))——運(yùn)行于Android、Linux、阿里云OS等主流操作系統(tǒng)之上,目前主要用于車載領(lǐng)域(AIOSForCar)和家居領(lǐng)域(AIOSForHome);

軟硬一體化的芯片模組,它提供聲源定位、個(gè)性喚醒、語(yǔ)音識(shí)別、語(yǔ)義理解、多輪對(duì)話等功能,主要用于家居和機(jī)器人領(lǐng)域。

云知聲

成立于2012年6月29日,一家智能語(yǔ)音識(shí)別AI技術(shù)企業(yè),專注于物聯(lián)網(wǎng)人工智能服務(wù)。2018年7月,云知聲宣布已完成6億元人民幣C+輪融資,至此,云知聲C輪系列融資總金額已達(dá)13億元人民幣。

主要產(chǎn)品介紹:

面向物聯(lián)網(wǎng)的AI芯片UniOne,這是一款擁有自主知識(shí)產(chǎn)權(quán)和語(yǔ)音解決方案的物聯(lián)網(wǎng)AI芯片,也是面向AIoT(AI+IoT)的AI芯片;

基于該款芯片的智慧家居和智能音箱方案,該方案可以幫助客戶完成語(yǔ)音項(xiàng)目開發(fā),加速客戶AI產(chǎn)品落地,同時(shí)為客戶定制AI語(yǔ)音模塊,快速量產(chǎn)。

出門問問

成立于2012年,一家以語(yǔ)音交互和軟硬結(jié)合為核心的人工智能公司,擁有自主研發(fā)的語(yǔ)音交互、智能推薦、計(jì)算機(jī)視覺及機(jī)器人SLAM技術(shù)。至2017年4月,出門問問共完成六輪融資,累計(jì)融資額超過2.55億美元。

主要產(chǎn)品介紹:

硬件產(chǎn)品包括:TicWatch系列、TicPods系列、TicKasa系列、TicBand、TicMirror、TicWear等,所有硬件都圍繞”出門問問”這款應(yīng)用,它既是一款語(yǔ)音助手App也是連接所有硬件的核心。

聲智科技

成立于2016年,一家專注聲學(xué)前沿技術(shù)和人工智能交互的科技創(chuàng)新公司,提供從端到云的智能語(yǔ)音交互技術(shù)和服務(wù)方案,以及從芯片、模組、開發(fā)板到白牌產(chǎn)品的智能語(yǔ)音應(yīng)用方案。

主要產(chǎn)品介紹:

SoundAIAzero,一款集成聲波配網(wǎng)、波束形成、聲源測(cè)向、噪聲抑制、混響消除、回聲消除、語(yǔ)音喚醒、端點(diǎn)檢測(cè)、語(yǔ)音識(shí)別、聲紋識(shí)別、語(yǔ)義理解、語(yǔ)音合成、雙工通話等全鏈條智能語(yǔ)音交互開發(fā)系統(tǒng),兼容主流智能語(yǔ)音芯片和硬件架構(gòu),支持DuerOS、AliGenies、小愛平臺(tái)、騰訊叮當(dāng)、Alexa等AI內(nèi)容平臺(tái);

SoundAI麥克風(fēng)陣列芯片,支持USB的低功耗麥克風(fēng)陣列芯片SAI101C;

SoundAI麥克風(fēng)陣列模組,基于聲智科技麥克風(fēng)陣列核心技術(shù)的軟硬一體化方案,實(shí)現(xiàn)全方向喚醒、聲源測(cè)向、定向拾音、噪聲抑制、混響消除、回聲抵消、語(yǔ)音識(shí)別、語(yǔ)義理解、聲紋識(shí)別、語(yǔ)音合成等功能,滿足用戶在語(yǔ)音交互領(lǐng)域的全方位需求。

捷通華聲

成立于2000年10月,是一家專注于智能語(yǔ)音、智能圖像、生物特征識(shí)別、智能語(yǔ)義等全方位人工智能技術(shù)研究與應(yīng)用,全面發(fā)展人工智能云服務(wù)的高新技術(shù)企業(yè)。

主要產(chǎn)品介紹:

靈云開放平臺(tái),合作伙伴可根據(jù)行業(yè)用戶實(shí)際應(yīng)用場(chǎng)景,靈活挑選、組合應(yīng)用多項(xiàng)項(xiàng)人工智能技術(shù),嵌入到系統(tǒng)集成商的平臺(tái)中,可為各個(gè)行業(yè)的企業(yè)辦公自動(dòng)化提供各種人工智能能力,實(shí)現(xiàn)智能化應(yīng)用。

語(yǔ)音合成,應(yīng)用靈云提供的TTS技術(shù),實(shí)時(shí)、準(zhǔn)確地將文本轉(zhuǎn)換為自然、流暢、清晰的語(yǔ)音;

語(yǔ)音識(shí)別,應(yīng)用靈云提供的ASR技術(shù),具備高識(shí)別準(zhǔn)確率、高識(shí)別速度、領(lǐng)域模型可定制、支持多種處理模式等功能,同時(shí)具有SDK開發(fā)簡(jiǎn)單、開發(fā)包資源占用小等優(yōu)勢(shì)。

聲紋識(shí)別,應(yīng)用靈云提供的VPR技術(shù),通過對(duì)說話者語(yǔ)音和數(shù)據(jù)庫(kù)中登記的聲紋做比較,從而確定該說話人是否為本人,文成對(duì)用戶進(jìn)行身份校驗(yàn)和鑒別。

智能語(yǔ)音導(dǎo)航,基于靈云平臺(tái)應(yīng)用靈云語(yǔ)音識(shí)別(ASR)、語(yǔ)音合成(TTS)、語(yǔ)義理解(NLU)等技術(shù),允許電話呼入的客戶以開放的方式表述業(yè)務(wù)需求,系統(tǒng)將用戶的語(yǔ)音轉(zhuǎn)化為文本。

智能語(yǔ)音質(zhì)檢,基于靈云平臺(tái)應(yīng)用靈云語(yǔ)音識(shí)別(ASR)技術(shù),將海量錄音數(shù)據(jù)進(jìn)行智能化的自動(dòng)語(yǔ)音轉(zhuǎn)文本、關(guān)鍵詞檢出、語(yǔ)速分析、靜音分析、情緒檢測(cè)等核心技術(shù)產(chǎn)品,可大大提高企業(yè)質(zhì)檢效率、解決人工質(zhì)檢局限性、提升服務(wù)質(zhì)量與管理水平、降低企業(yè)運(yùn)營(yíng)成本,輔助業(yè)務(wù)經(jīng)營(yíng)決策。

SpeakIn

成立于2015年,一家全球領(lǐng)先的聲紋識(shí)別與身份安全人工智能公司,2018年5月SpeakIn及其全資子公司國(guó)音科技宣布完成近近億元人民幣融資,本輪融資由IDG資本領(lǐng)投。

主要產(chǎn)品介紹:

SpeakIn核心算法,使用目前學(xué)術(shù)界最前沿、基于深度學(xué)習(xí)聲紋識(shí)別技術(shù),使用大數(shù)據(jù)訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)(DNN)能夠提取出更準(zhǔn)確的說話人特征,擁有多種聲紋識(shí)別的前端音頻信號(hào)處理算法,極大的提高了準(zhǔn)確度和魯棒性,確保聲紋提取和驗(yàn)證的速度,并適應(yīng)多種不同場(chǎng)景與應(yīng)用的需求。

SpeakIn核心技術(shù),包括活體檢測(cè)技術(shù)、情緒識(shí)別、人聲分離、性別識(shí)別、聲紋大數(shù)據(jù)檢索與比對(duì)、云平臺(tái)技術(shù)、動(dòng)態(tài)聲紋數(shù)據(jù)庫(kù)技術(shù)、自研聲紋采集專用硬件、前瞻性研究等。

百度

主要產(chǎn)品介紹:

語(yǔ)音識(shí)別,通過場(chǎng)景識(shí)別優(yōu)化,為車載導(dǎo)航,智能家居和社交聊天等行業(yè)提供語(yǔ)音解決方案;

長(zhǎng)語(yǔ)音識(shí)別,在會(huì)議、教學(xué)或者媒體采訪中,長(zhǎng)語(yǔ)音識(shí)別服務(wù)可快速準(zhǔn)確的將長(zhǎng)時(shí)間的語(yǔ)音轉(zhuǎn)化為文字,方便進(jìn)行拷貝和編輯等后續(xù)的工作;

遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別,通過麥克風(fēng)陣列前端處理算法,有效消除噪音,同時(shí)對(duì)目標(biāo)說話人聲音進(jìn)行增強(qiáng),使得智能家居、智能硬件、機(jī)器人語(yǔ)音交互等場(chǎng)景下的遠(yuǎn)場(chǎng)語(yǔ)音也可準(zhǔn)確識(shí)別;

呼叫中心實(shí)時(shí)語(yǔ)音識(shí)別,通過MRCP或TCP協(xié)議進(jìn)行低成本對(duì)接,將語(yǔ)音訊號(hào)轉(zhuǎn)化為文本流實(shí)時(shí)輸出。應(yīng)用于智能客服,外呼機(jī)器人,實(shí)時(shí)電話質(zhì)檢,電銷輔助機(jī)器人等場(chǎng)景;

呼叫中心音頻文件轉(zhuǎn)寫,可將電銷業(yè)務(wù)、客服業(yè)務(wù)、質(zhì)檢業(yè)務(wù)等多場(chǎng)景的語(yǔ)音精準(zhǔn)地轉(zhuǎn)為文字。

騰訊

語(yǔ)音識(shí)別,依托騰訊的語(yǔ)音技術(shù),為開發(fā)者提供全面優(yōu)質(zhì)的語(yǔ)音轉(zhuǎn)文字功能。

長(zhǎng)語(yǔ)音識(shí)別,依托騰訊的語(yǔ)音技術(shù),為開發(fā)者提供全面優(yōu)質(zhì)的近場(chǎng)長(zhǎng)段語(yǔ)音轉(zhuǎn)文字功能,目前支持漢語(yǔ)普通話,并涵蓋南北地域重口音。

關(guān)鍵詞檢索依托微信AI的語(yǔ)音技術(shù),在給定關(guān)鍵詞文本列表的前提下,在音頻中精準(zhǔn)定位出現(xiàn)了哪個(gè)或哪幾個(gè)關(guān)鍵詞、具體時(shí)間起止點(diǎn)以及置信度,比語(yǔ)音識(shí)別更高效。

語(yǔ)音合成,依托騰訊領(lǐng)先的語(yǔ)音技術(shù)和深度學(xué)習(xí)算法,為開發(fā)者提供全面優(yōu)質(zhì)的文字轉(zhuǎn)語(yǔ)音服務(wù)。

小米

小愛同學(xué)語(yǔ)音服務(wù)基于小米聲學(xué)實(shí)驗(yàn)室、大數(shù)據(jù)及全生態(tài)建設(shè),涵蓋語(yǔ)音、NLP、搜索推薦等技術(shù),為開發(fā)者提供高效、便捷、智能的語(yǔ)音服務(wù)。小愛同學(xué)語(yǔ)音服務(wù)涵蓋影音視聽,實(shí)用工具,生活,知識(shí)教育,游戲趣玩,休閑娛樂,兒童等近百款自研精品技能及上千款第三方技能,且支持語(yǔ)音控制所有小米IoT設(shè)備。

總結(jié)

語(yǔ)音識(shí)別的最終目的是能夠真正的理解人類語(yǔ)言甚至是方言,過去幾年,人們?cè)谌斯ぶ悄茴I(lǐng)域和深度學(xué)習(xí)領(lǐng)域的突破,讓語(yǔ)音識(shí)別取得了很大的進(jìn)步,然而在方言識(shí)別方面,還極少公司取得比較矚目的成績(jī),語(yǔ)言理解本身就是一個(gè)復(fù)雜的領(lǐng)域,期待未來能夠有更多突破。

更多精彩閱讀:

語(yǔ)音識(shí)別的兩個(gè)方法_語(yǔ)音識(shí)別的應(yīng)用有哪些

語(yǔ)音識(shí)別的優(yōu)缺點(diǎn)_語(yǔ)音識(shí)別功能介紹

語(yǔ)音識(shí)別算法有哪些_語(yǔ)音識(shí)別特征提取方法

怎么實(shí)現(xiàn)語(yǔ)音識(shí)別_手機(jī)語(yǔ)音識(shí)別怎么設(shè)置

語(yǔ)音識(shí)別設(shè)置能刪除嗎_語(yǔ)音識(shí)別系統(tǒng)工作流程

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 語(yǔ)音識(shí)別
    +關(guān)注

    關(guān)注

    38

    文章

    1710

    瀏覽量

    112489
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46652

    瀏覽量

    237060
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

    的效率,還為科學(xué)研究提供了前所未有的洞察力和精確度。例如,在生物學(xué)領(lǐng)域,AI能夠幫助科學(xué)家快速識(shí)別基因序列中的關(guān)鍵變異,加速新藥研發(fā)進(jìn)程。 2. 跨學(xué)科融合的新范式 書中強(qiáng)調(diào),人工智能的應(yīng)用促進(jìn)了多個(gè)
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應(yīng)用前景分析

    、RISC-V在人工智能圖像處理中的應(yīng)用案例 目前,已有多個(gè)案例展示了RISC-V在人工智能圖像處理中的應(yīng)用潛力。例如: Esperanto技術(shù)公司 :該公司制造的首款高性能RISC-
    發(fā)表于 09-28 11:00

    名單公布!【書籍評(píng)測(cè)活動(dòng)NO.44】AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新

    每個(gè)交叉領(lǐng)域,本書通過案例進(jìn)行了詳盡的介紹,梳理了產(chǎn)業(yè)地圖,并給出了相關(guān)政策啟示。 《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》適合所有關(guān)注人工智能技術(shù)和產(chǎn)業(yè)發(fā)展的讀者閱讀,特別適合材料科學(xué)
    發(fā)表于 09-09 13:54

    報(bào)名開啟!深圳(國(guó)際)通用人工智能大會(huì)將啟幕,國(guó)內(nèi)外大咖齊聚話AI

    ,得到了華為、騰訊、優(yōu)必選、中煤科工、中國(guó)聯(lián)通、云天勵(lì)飛、考拉悠然、智航、力維智聯(lián)等國(guó)內(nèi)人工智能企業(yè)的深度參與和大力支持。 報(bào)名后即可到現(xiàn)場(chǎng)領(lǐng)取禮品,總計(jì)5000份,先到先選! 點(diǎn)擊報(bào)名:https://bbs.elecfans.com/jishu_2447254_1_1.html
    發(fā)表于 08-22 15:00

    FPGA在人工智能中的應(yīng)用有哪些?

    FPGA(現(xiàn)場(chǎng)可編程門陣列)在人工智能領(lǐng)域的應(yīng)用非常廣泛,主要體現(xiàn)在以下幾個(gè)方面: 一、深度學(xué)習(xí)加速 訓(xùn)練和推理過程加速:FPGA可以用來加速深度學(xué)習(xí)的訓(xùn)練和推理過程。由于其高并行性和低延遲特性
    發(fā)表于 07-29 17:05

    圖像識(shí)別屬于人工智能

    屬于。圖像識(shí)別人工智能(Artificial Intelligence, AI)領(lǐng)域的一個(gè)重要分支。 一、圖像識(shí)別概述 1.1 定義 圖像識(shí)別是指利用計(jì)算機(jī)技術(shù)對(duì)圖像中的內(nèi)容進(jìn)行分析
    的頭像 發(fā)表于 07-16 10:44 ?874次閱讀

    人工智能語(yǔ)音識(shí)別技術(shù)詳解

    隨著科技的飛速發(fā)展,人工智能(AI)技術(shù)已經(jīng)滲透到我們生活的方方面面,其中語(yǔ)音識(shí)別技術(shù)作為AI領(lǐng)域的重要分支,更是以其獨(dú)特的魅力和廣泛的應(yīng)用前景,引起了社會(huì)各界的廣泛關(guān)注。本文將詳細(xì)介
    的頭像 發(fā)表于 07-01 11:39 ?971次閱讀

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V2)

    ://t.elecfans.com/v/27221.html *附件:初學(xué)者完整學(xué)習(xí)流程實(shí)現(xiàn)手寫數(shù)字識(shí)別案例_V2-20240506.pdf 人工智能 語(yǔ)音對(duì)話機(jī)器人案例 26分03秒 https
    發(fā)表于 05-10 16:46

    **十萬級(jí)口語(yǔ)識(shí)別,離線自然說技術(shù),讓智能照明更懂你**

    隨著人工智能技術(shù)的普及,智能家居設(shè)備開始走進(jìn)千萬戶。而智能照明系統(tǒng)作為其不可或缺的一部分,占據(jù)著舉足輕重的地位。 所謂智能照明,就是通過
    發(fā)表于 04-29 17:09

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V1)

    *附件:初學(xué)者完整學(xué)習(xí)流程實(shí)現(xiàn)手寫數(shù)字識(shí)別案例.pdf 人工智能 語(yǔ)音對(duì)話機(jī)器人案例 26分03秒 https://t.elecfans.com/v/27185.html *附件:語(yǔ)音
    發(fā)表于 04-01 10:40

    嵌入式人工智能的就業(yè)方向有哪些?

    。 國(guó)內(nèi)外科技巨頭紛紛爭(zhēng)先入局,在微軟、谷歌、蘋果、臉書等積極布局人工智能的同時(shí),國(guó)內(nèi)的BAT、華為、小米等科技公司也相繼切入到嵌入式人工智能
    發(fā)表于 02-26 10:17

    人工智能語(yǔ)音公司ElevenLabs完成8000萬美元融資,躋身獨(dú)角獸行列

    近日,倫敦人工智能語(yǔ)音公司 ElevenLabs 宣布在最新一輪融資中成功籌集 8000 萬美元,估值飆升至 11 億美元,正式躋身獨(dú)角獸行列。這標(biāo)志著 ElevenLabs 在人工智能
    的頭像 發(fā)表于 01-23 16:10 ?589次閱讀

    語(yǔ)音數(shù)據(jù)集:推動(dòng)人工智能語(yǔ)音技術(shù)的關(guān)鍵要素

    、應(yīng)用、挑戰(zhàn)及發(fā)展前景進(jìn)行簡(jiǎn)要概述。 一、語(yǔ)音數(shù)據(jù)集的重要性 語(yǔ)音數(shù)據(jù)集是人工智能語(yǔ)音技術(shù)的基石。它們?yōu)槟P陀?xùn)練提供了大量的語(yǔ)音樣本,使得模
    的頭像 發(fā)表于 12-29 11:00 ?547次閱讀

    語(yǔ)音數(shù)據(jù)集在人工智能中的應(yīng)用與挑戰(zhàn)

    一、引言 隨著人工智能技術(shù)的快速發(fā)展,語(yǔ)音數(shù)據(jù)集在各種應(yīng)用中發(fā)揮著越來越重要的作用。語(yǔ)音數(shù)據(jù)集是AI語(yǔ)音技術(shù)的基石,對(duì)于語(yǔ)音
    的頭像 發(fā)表于 12-14 15:00 ?631次閱讀

    離線語(yǔ)音識(shí)別及控制是怎樣的技術(shù)?

    引言:  隨著人工智能的飛速發(fā)展,離線語(yǔ)音識(shí)別技術(shù)成為了一項(xiàng)備受矚目的創(chuàng)新。離線語(yǔ)音識(shí)別技術(shù)能夠?qū)⑷说?b class='flag-5'>語(yǔ)
    發(fā)表于 11-24 17:41