導讀
近日,機器聽覺解決方案供應商大象聲科(Elevoc)宣布獲得小米和高通創(chuàng)投的數(shù)千萬人民幣的Pre-A輪戰(zhàn)略投資。
近日,機器聽覺解決方案供應商大象聲科(Elevoc)宣布獲得小米和高通創(chuàng)投的數(shù)千萬人民幣的Pre-A輪戰(zhàn)略投資。摯金資本擔任本輪融資的獨家財務顧問。大象聲科表示,該輪融資具有廣泛重要的戰(zhàn)略意義,將有利于強化上下游產業(yè)鏈,進一步賦能通訊、智能家居、智能車載、可穿戴設備、安防等行業(yè)客戶。
大象聲科是一家語音信號處理引擎提供商,2015年創(chuàng)立于美國硅谷,目前總部位于深圳。公司匯聚了以俄亥俄州立大學國際著名學者、IEEE Fellow汪德亮教授為代表的人工智能語音交互領域優(yōu)秀的科學家團隊,依托算法、軟件、硬件三個維度的技術縱深,為語音增強和智能語音交互提供解決方案。
語音增強技術,深度學習驅動
語音增強,本質就是語音降噪。在收錄聲音時,往往被嘈雜的環(huán)境背景聲所“污染”,語音增強可以從噪音中提取有效的聲音信號,恢復“干凈”的語音。
語音增強涉及的應用領域非常廣泛,包括語音通話、電話會議、現(xiàn)場錄音、軍事通信、助聽器設備和語音識別設備等,并成為許多語音編碼和識別系統(tǒng)的預處理模塊。
提到語音增強技術,就不得不提出計算機語音識別領域注明的“雞尾酒會問題”。“雞尾酒會問題”指在如雞尾酒會嘈雜的環(huán)境下的強干擾下,辨識出一種聲音難度是很高的,語音識別率極低。如何在混合信號中識別出每個人的獨立信號成了技術難題。
深度學習語音增強技術是該領域的新起之秀,卻有攻入破竹之勢。不同于主流而傳統(tǒng)的數(shù)字信號處理方法,它借鑒機器學習的思路,通過有監(jiān)督的訓練實現(xiàn)語音增強,可以解決瞬時降噪等技術難題。華為今年發(fā)布的mate10手機,已成功地將該技術應用到了復雜聲學環(huán)境中的語音通話中。而今年4月,刷遍朋友圈的錘子手機新品堅果3采用的AI語音降噪技術,就是來自大象聲科的深度學習語音提取技術。
目前,大象聲科已經成功推出了全球首款芯片級單通道人工智能語音增強方案,在不依賴物理硬件的情況下,有效實現(xiàn)了噪音和人聲的分離,并在手機通訊行業(yè)率先進行了商用,開啟了人類無噪音通訊時代。此外,大象聲科將單通道語音增強技術與麥克風陣列結合,將多通道語音增強的性能也提升到新臺階,真正解決了語音前端處理的技術難點。應用場景有智能手機、對講機、耳機、麥克風、在線教育平臺、網絡視頻會議、語音客服等。
為機器人打造智能耳朵的生意,資本看好
小米首席架構師、人工智能與云平臺副總裁崔寶秋表示:“智能語音已經成了新一代人機交互入口的必爭之地,鑒于AI在語音以及其他領域的深度應用,我們將AI定為小米未來十年最重要的戰(zhàn)略之一。 大象聲科的技術團隊基于多年對計算聽覺場景分析的研究和積累,創(chuàng)造性地采用深度學習技術解決聽覺領域中著名的‘雞尾酒會問題’,擁有全球領先的核心算法。我相信小米與大象聲科的合作,一定會為小米以及小米生態(tài)鏈下一代系列智能語音產品帶來更精彩的人機交互體驗?!?/p>
高通全球副總裁兼高通創(chuàng)投董事總經理沈勁表示,“人工智能正在從云端向終端遷移,高通作為技術提供商,一直在積極地關注并加速在終端側人工智能的布局,大象聲科擁有業(yè)界領先的語音增強和智能語音交互解決方案,勢必會讓更多的終端設備受益于人工智能技術,加快終端智能化生態(tài)的發(fā)展?!?/p>
大象聲科創(chuàng)始人兼CEO苗健彰表示:“ 雖然人工智能技術的發(fā)展已經取得了長足進步,但是要實現(xiàn)人性化的的語音交互還有許多關鍵問題有待解決,機器聽覺就是其中之一。自創(chuàng)立伊始,大象聲科便樹立了為機器人打造智能耳朵的目標。大象聲科在機器聽覺理論研究上一直走在世界前沿,聯(lián)合創(chuàng)始人汪德亮教授和張學良教授在該領域有超過20年的技術積累。特別是汪教授不僅是機器聽覺領域的重要理論——計算聽覺場景分析(CASA)的奠基人之一,還是全球第一位將深度學習應用于語音增強的學界泰斗?!?/p>
下一步,大象聲科將依托自身行業(yè)領先的技術優(yōu)勢,整合小米和高通創(chuàng)投的戰(zhàn)略資源,聯(lián)合通訊、智能硬件、安防等領域的優(yōu)質客戶,共同將高品質和便利的人工智能服務帶進千家萬戶。
據(jù)了解,2018年中國智能硬件市場規(guī)模預計將突破4000億元,全球語音產業(yè)規(guī)模預計也將突破100億美元,語音產業(yè)結構將順延硬件產品、AI軟件、語音應用Apps、生態(tài)系統(tǒng)服務相結合的架構繼續(xù)高速發(fā)展。語音交互將成為主流的人機交互方式之一,音訊處理的需求也將快速擴張。
-
高通
+關注
關注
76文章
7334瀏覽量
189580 -
機器人
+關注
關注
210文章
27838瀏覽量
204579 -
深度學習
+關注
關注
73文章
5422瀏覽量
120588
原文標題:雷軍砸下數(shù)千萬,這家機器聽覺公司魅力何在?
文章出處:【微信號:robotn,微信公眾號:產業(yè)大視野】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論