01技術(shù)篇
DUI平臺(tái),走向定制規(guī)模化之路
2017年9月,思必馳,在多年智能語(yǔ)音技術(shù)基礎(chǔ)上,以Dialogue為核心,結(jié)合GUI和VUI,自主研發(fā)了全鏈路智能對(duì)話定制平臺(tái)——DUI,為開(kāi)發(fā)者提供高可用定制的人機(jī)對(duì)話技術(shù)服務(wù),為智能終端開(kāi)發(fā)者提供核心交互能力,協(xié)助傳統(tǒng)設(shè)備實(shí)現(xiàn)智能升級(jí)。
DUI致力構(gòu)建以場(chǎng)景服務(wù)為基礎(chǔ),以用戶為中心的自由人機(jī)交互體驗(yàn),支持自由調(diào)用圖文、列表、音樂(lè)、內(nèi)嵌網(wǎng)頁(yè)等多種控件,提供從喚醒、語(yǔ)音識(shí)別、語(yǔ)義理解到對(duì)話管理、內(nèi)容輸出、TTS播報(bào)的全鏈路技術(shù)的超高度定制。DUI還擁有優(yōu)秀的大數(shù)據(jù)平臺(tái)和產(chǎn)品運(yùn)營(yíng)中心,幫助開(kāi)發(fā)者快速優(yōu)化產(chǎn)品;秒級(jí)在線熱更新,用戶體驗(yàn)更流暢。DUI平臺(tái)將賦能智能終端、APP端、網(wǎng)頁(yè)端、微信端等多種終端,讓更多產(chǎn)品能夠快速接入語(yǔ)音功能。
八大技術(shù)升級(jí),打造更人性化的對(duì)話交互
1. 推出聲紋識(shí)別方案
基于喚醒的聲紋認(rèn)證,提供更安全的身份保障和個(gè)性化體驗(yàn)。聲紋識(shí)別包括說(shuō)話人辨識(shí)(Speaker Identification,簡(jiǎn)稱(chēng)SI,一對(duì)N的關(guān)系)和說(shuō)話人確認(rèn)(Speaker Verification,簡(jiǎn)稱(chēng) SV,一對(duì)一的關(guān)系)。思必馳聲紋識(shí)別方案,基于單麥的純軟算法,集內(nèi)準(zhǔn)確率在95%以上,能夠被應(yīng)用于聲紋開(kāi)鎖、語(yǔ)音支付、個(gè)性化推薦、安防認(rèn)證等場(chǎng)景。
2. 推出雙麥陣列方案
雙波束動(dòng)態(tài)噪聲抑制和回聲消除,支持平面180度遠(yuǎn)場(chǎng)拾音,有效提升語(yǔ)音交互體驗(yàn)。思必馳雙麥陣列方案,可廣泛應(yīng)用于車(chē)載和家居場(chǎng)景下的中遠(yuǎn)場(chǎng)交互,在噪音環(huán)境中也有不錯(cuò)的喚醒和識(shí)別理解能力,是一個(gè)超高性?xún)r(jià)比的軟硬一體化解決方案。
3. 語(yǔ)音喚醒升級(jí)
設(shè)備喚醒的高靈敏,容易觸發(fā)更多的誤喚醒。用戶在聊天或者看電視的時(shí)候,就常常遇到旁邊的智能音箱突然被喚醒,被“插話”,讓用戶不勝其煩。此前,大部分產(chǎn)品能達(dá)到2次/24小時(shí)的誤喚醒率已經(jīng)算是不錯(cuò)的水平。而思必馳最新的技術(shù)優(yōu)化后,在維持超高喚醒率的同時(shí),誤喚醒相對(duì)降低60%,500h+實(shí)測(cè),每48小時(shí)誤喚醒僅一次。
4. 推出TTS快速定制方案
思必馳小數(shù)據(jù)快速定制TTS,在傳統(tǒng)的HMM訓(xùn)練后得到源發(fā)音人的模型參數(shù),將原始模型的mixture component聚類(lèi)成若干類(lèi),利用MLLR和目標(biāo)發(fā)音人的數(shù)據(jù)求取源發(fā)音人到目標(biāo)發(fā)音人的轉(zhuǎn)換模型。僅需提供5-10分鐘音頻素材,經(jīng)過(guò)機(jī)器的模型訓(xùn)練,即可合成聲音,讓任意文本都可秒變成用戶的聲音。
5. 語(yǔ)音識(shí)別魯棒性能力提高
噪聲環(huán)境下的語(yǔ)音識(shí)別一直以來(lái)是一個(gè)難題。在面對(duì)真實(shí)環(huán)境下的多類(lèi)別強(qiáng)噪聲情況環(huán)境(比如車(chē)載噪聲、家居遠(yuǎn)場(chǎng)回聲等),識(shí)別性能有所受影響。思必馳VDCNN算法,在噪聲環(huán)境語(yǔ)音識(shí)別的業(yè)界基準(zhǔn)庫(kù)Aurora4上,取得了7.09%的詞錯(cuò)誤率,在降噪處理上表現(xiàn)出不可取代的優(yōu)勢(shì),在強(qiáng)干擾和強(qiáng)混響的真實(shí)環(huán)境中,識(shí)別率相對(duì)以往提高20%。
6. 上線語(yǔ)言模型定制功能
通用的模型無(wú)法滿足開(kāi)發(fā)者的多樣化需求。在應(yīng)用場(chǎng)景中,內(nèi)容資源、語(yǔ)言模型與語(yǔ)義需要三者配合好。對(duì)于像“MC子龍”類(lèi)的特定詞匯,添加到詞庫(kù)或說(shuō)法里,會(huì)作為語(yǔ)料用于訓(xùn)練識(shí)別語(yǔ)言模型和語(yǔ)義解析模型,通過(guò)思必馳 DUI平臺(tái)釋放的技術(shù)服務(wù),即可準(zhǔn)確識(shí)別。解碼資源實(shí)施同步,最快秒級(jí)完成熱更新,實(shí)現(xiàn)無(wú)感知的交互體驗(yàn)升級(jí)。
7. NLU能力升級(jí)
結(jié)合上下文的對(duì)話理解和對(duì)話管理技術(shù)提供了更加靈活的對(duì)話交互和更精細(xì)的場(chǎng)景劃分,支持可隨時(shí)打斷、智能糾錯(cuò)的多輪對(duì)話和漸進(jìn)式上下文理解。通過(guò)增強(qiáng)實(shí)體識(shí)別、實(shí)體關(guān)系抽取和大規(guī)模知識(shí)圖譜應(yīng)用,促進(jìn)機(jī)器學(xué)習(xí)和知識(shí)庫(kù)技術(shù)深度融合,使得意圖識(shí)別能力顯著提高10%。同時(shí)與第三方內(nèi)容服務(wù)深度耦合,打造更實(shí)用的人機(jī)交互體驗(yàn)。
8. 對(duì)話能力升級(jí)
以任務(wù)型對(duì)話為核心,兼具閑聊、問(wèn)答與命令對(duì)話,引入知識(shí)圖譜,實(shí)體概念,維基百科等形式,打造基于GUI+VUI的多模交互,實(shí)現(xiàn)“語(yǔ)音+觸控”的完美結(jié)合。思必馳DUI所集成的核心智能對(duì)話技術(shù)具有超高度可定制性,實(shí)現(xiàn)了從本地端設(shè)備到云端服務(wù),從識(shí)別到合成,從語(yǔ)義領(lǐng)域到對(duì)話邏輯,從技術(shù)模塊到內(nèi)容資源的全方位定制支持。
AIOS智能車(chē)載技術(shù)方案
思必馳于2015年10月推出了AIOS for Car對(duì)話操作系統(tǒng),2017年初,該方案升級(jí)至AIOS3.3版本,新增十一大功能:one-shot一把說(shuō)、離線導(dǎo)航功能、偏好導(dǎo)航功能、導(dǎo)航中的快捷交互、隨意打斷/搶說(shuō)、合成音切換、音樂(lè)中的快捷交互、聽(tīng)歌識(shí)曲、微信及微信地圖接人、自定義喚醒詞、路況及限行查詢(xún)。目前,該方案已廣泛應(yīng)用于當(dāng)前的車(chē)載后裝市場(chǎng),為用戶的駕乘生活帶來(lái)更流暢的交互體驗(yàn)。后期,AIOS將與DUI無(wú)縫融合,性能不變,體驗(yàn)升級(jí)。
針對(duì)遠(yuǎn)場(chǎng)交互的麥克風(fēng)陣列方案
遠(yuǎn)場(chǎng)交互和魯棒性是近兩年的智能硬件剛需,尤其是在家居環(huán)境下的3~5米遠(yuǎn)場(chǎng)交互,和車(chē)載環(huán)境下的近場(chǎng)復(fù)雜噪音環(huán)境下。2017年,思必馳推出了多款麥克風(fēng)陣列方案:
環(huán)形6麥方案:支持5米遠(yuǎn)場(chǎng)交互和360°全角度拾音,±10°聲源定位,適用于智能音箱、家居中控等智能硬件產(chǎn)品。
線性4麥方案:支持5米遠(yuǎn)場(chǎng)交互和180°拾音,適用于智能電視、智能冰箱、智能空調(diào)等位置相對(duì)固定的智能硬件產(chǎn)品。
雙麥方案:適用于家居和車(chē)載環(huán)境里的中遠(yuǎn)場(chǎng)交互,擁有極好的降噪處理能力,適合輕需求的智能音箱、智能后視鏡等。
智能機(jī)器人/故事機(jī)技術(shù)方案
智能機(jī)器人/故事機(jī)市場(chǎng)無(wú)疑是今年的一大熱點(diǎn),在前端語(yǔ)音處理上,思必馳的麥克風(fēng)陣列方案解決了遠(yuǎn)場(chǎng)環(huán)境下的痛點(diǎn)。思必馳憑借著強(qiáng)大的語(yǔ)音交互能力、領(lǐng)先的TTS播報(bào)、海量的聚類(lèi)資源、強(qiáng)有力的AI內(nèi)芯快速拓展了市場(chǎng),同時(shí),思必馳已積累數(shù)十個(gè)領(lǐng)域的自建資源庫(kù)、并與眾多第三方知名內(nèi)容達(dá)成戰(zhàn)略合作。自建資源的豐富累積,讓機(jī)器人/ 故事機(jī)更聰明!
02市場(chǎng)合作篇
目前思必馳已與眾多業(yè)界知名公司達(dá)成合作,包括阿里、騰訊、小米、富士康、聯(lián)想、360、海爾、浙江大華等,在智能硬件泛物聯(lián)網(wǎng)領(lǐng)域打造了多款行業(yè)爆品。數(shù)億用戶通過(guò)思必馳自然語(yǔ)言交互,實(shí)現(xiàn)與智能終端的互動(dòng)交流。
2017年,思必馳在智能車(chē)載、智能家居、智能機(jī)器人/故事機(jī)領(lǐng)域的合作全面突破,收獲頗豐。
智能車(chē)載:暢享自由駕駛
思必馳攜手合作伙伴,打造了小米板牙70邁智能后視鏡、車(chē)蘿卜HUD、捷渡遠(yuǎn)界智能后視鏡一二三代、掌訊車(chē)機(jī)(方案商)等多品類(lèi)產(chǎn)品。截止目前,思必馳在智能車(chē)載后裝市場(chǎng)占有率約達(dá)60%,穩(wěn)居行業(yè)第一,智能后視鏡領(lǐng)域達(dá)70%,智能HUD領(lǐng)域達(dá)80%。
智能家居:樂(lè)享智慧生活
在今年機(jī)器火爆的智能音箱市場(chǎng),AISpeech Inside出貨量行業(yè)第一,天貓精靈X1、小米小愛(ài)同學(xué)、聯(lián)想智能音箱、小米互聯(lián)網(wǎng)音箱等產(chǎn)品均采用了思必馳語(yǔ)音技術(shù)方案,其中天貓精靈雙十一賣(mài)出100+萬(wàn)臺(tái),小米小愛(ài)同學(xué)開(kāi)售23秒售罄,備受市場(chǎng)追捧。
除智能音箱外,思必馳攜手合作伙伴打造了聯(lián)想智能電視、諸葛小明智能臺(tái)燈、小米藍(lán)牙語(yǔ)音遙控器、海爾馨廚冰箱等多款多類(lèi)目家居產(chǎn)品,讓智能語(yǔ)音走進(jìn)千家萬(wàn)戶。
智能機(jī)器人/故事機(jī):感受萌動(dòng)心聲
兒童機(jī)器人/故事機(jī)市場(chǎng)今年尤為火熱,在這一領(lǐng)域,目前思必馳品牌覆蓋率行業(yè)第一, 打造了夏普曉樂(lè)、水果兔故事機(jī)、火火兔平板、牛聽(tīng)聽(tīng)故事機(jī)、小蘿卜兒童機(jī)器人、貝貝禮兒童故事機(jī)等多款產(chǎn)品,激活兒童故事機(jī)市場(chǎng)。這些產(chǎn)品的銷(xiāo)量在行業(yè)內(nèi)遙遙領(lǐng)先。
03團(tuán)隊(duì)篇
思必馳總部在蘇州,并在深圳設(shè)立商務(wù)辦事處,在北京設(shè)立研發(fā)院和市場(chǎng)部,在上海與上海交通大學(xué)設(shè)立了基礎(chǔ)研究中心(聯(lián)合實(shí)驗(yàn)室)。目前,思必馳團(tuán)隊(duì)400余人,其中近一半為研發(fā)工程師,大都來(lái)自國(guó)內(nèi)外知名的高校和研究院所,如劍橋大學(xué)、香港科技大學(xué)、新加坡國(guó)立大學(xué)、以色列理工、清華、北大、上海交大、中科院及中科大等等,核心研發(fā)團(tuán)隊(duì)成員全部為本科及其以上學(xué)歷,其中碩士比例約占60%,博士占比約為20%。同時(shí),思必馳也匯聚了來(lái)自阿里、騰訊、百度、樂(lè)視、英特爾、華為、滴滴等行業(yè)巨頭的資深專(zhuān)家。
2017年思必馳迎來(lái)了多位大咖的加盟。初敏博士,2017年9月加入思必馳,任思必馳副總裁,北京研發(fā)院院長(zhǎng),負(fù)責(zé)技術(shù)的新場(chǎng)景探索和業(yè)務(wù)落地。趙恒藝,2017年1月加入思必馳,任思必馳副總裁、DUI平臺(tái)總經(jīng)理,負(fù)責(zé)DUI平臺(tái)項(xiàng)目整體運(yùn)營(yíng)和發(fā)展。此外,來(lái)自聯(lián)想之星、PPTV、明道數(shù)據(jù)等多位行業(yè)大咖加入思必馳,攜手前行,共探發(fā)展。
04榮譽(yù)篇
2017年在榮耀的聚光燈下,我們受到了極大的關(guān)注!
2017年4月,CCTV-2《經(jīng)濟(jì)半小時(shí)》以30分鐘篇幅全方面報(bào)道了關(guān)于思必馳的產(chǎn)學(xué)研一體化發(fā)展之路(CCTV-2《經(jīng)濟(jì)半小時(shí)》:看思必馳的披荊斬棘之路)。
2017年9月,CCTV-1《機(jī)智過(guò)人》展現(xiàn)思必馳語(yǔ)音合成技術(shù)(CCTV-1《機(jī)智過(guò)人》小馳一展歌喉,這是你不知道的歌聲合成?。?。
2017年11月,CCTV-1《機(jī)智過(guò)人》展現(xiàn)思必馳聲紋識(shí)別技術(shù)(聲紋識(shí)別 |“小思”P(pán)K霍尊辨識(shí)小青衣,這是來(lái)自人工智能的暴擊?。?。
同時(shí),思必馳入選了Gartner“2017東亞五大明星AI創(chuàng)業(yè)公司”,并再度被高盛評(píng)為“全球人工智能關(guān)鍵參與者”。2017年,思必馳斬獲了大大小小近百項(xiàng)榮譽(yù)。
05打造AI生態(tài)
未來(lái),思必馳將繼續(xù)加速在物聯(lián)網(wǎng)領(lǐng)域的深入和拓展,整體布局,打造AI生態(tài),賦能萬(wàn)物。
完善AI產(chǎn)業(yè)鏈布局
在整體生態(tài)方面,針對(duì)AI領(lǐng)域,思必馳于2016年成立馳星創(chuàng)投,得到了元禾資本、富士康、清華控股等LP的支持,旗下?lián)碛袃芍Щ?,分別為2億元天使基金和10億元成長(zhǎng)基金,專(zhuān)注投資人工智能和智能交互產(chǎn)業(yè)早期項(xiàng)目。思必馳對(duì)AI領(lǐng)域的關(guān)注并不僅局限在人工智能物聯(lián)網(wǎng)上下游產(chǎn)業(yè)鏈,也關(guān)注傳統(tǒng)行業(yè),促進(jìn)傳統(tǒng)行業(yè)的快速轉(zhuǎn)型,例如擴(kuò)展到了教育、醫(yī)療等。思必馳產(chǎn)業(yè)基金已成功孵化并投資了車(chē)蘿卜、慧聲、先聲教育、AITEK、SIGMOID、愛(ài)醫(yī)聲、RT-Thread等9家企業(yè)。
推進(jìn)AI產(chǎn)業(yè)化進(jìn)程
思必馳著力推進(jìn)AI產(chǎn)業(yè)化的進(jìn)程。2017年9月推出的DUI開(kāi)放平臺(tái),將對(duì)話技術(shù)賦能給更多智能終端,推進(jìn)語(yǔ)音技術(shù)的規(guī)?;瘧?yīng)用。同期,阿里原iDST語(yǔ)音負(fù)責(zé)人初敏博士加入思必馳成立北京研發(fā)院,以針對(duì)企業(yè)的主動(dòng)交互式智能服務(wù)為切入點(diǎn),推動(dòng)AI產(chǎn)業(yè)化的進(jìn)程!
專(zhuān)注源頭技術(shù)創(chuàng)新與發(fā)展
思必馳是AI技術(shù)型企業(yè),思必馳堅(jiān)信,技術(shù)型企業(yè)的真正比拼并不在萬(wàn)眾矚目的聚光燈下,技術(shù)軟硬實(shí)力才是長(zhǎng)久之策。未來(lái),依托蘇州研發(fā)總部、北京研發(fā)院、蘇州人工智能研究院的基礎(chǔ)性研究和應(yīng)用性探索,思必馳將不斷拓展智能語(yǔ)音的應(yīng)用場(chǎng)景和領(lǐng)域,帶動(dòng)AI語(yǔ)音技術(shù)的推陳出新,賦能更多智能終端產(chǎn)品,推動(dòng)傳統(tǒng)行業(yè)轉(zhuǎn)型,讓語(yǔ)音近在咫尺,走進(jìn)未來(lái)智能生活。
2018 我們,攜手同行!
-
人工智能
+關(guān)注
關(guān)注
1787文章
46090瀏覽量
235267 -
語(yǔ)音交互
+關(guān)注
關(guān)注
3文章
282瀏覽量
27914 -
思必馳
+關(guān)注
關(guān)注
4文章
263瀏覽量
14234
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論