多數(shù)語音技術(shù)已經(jīng)進(jìn)入穩(wěn)步爬升期,智能語音賽道進(jìn)入成熟發(fā)展期。
中國語音產(chǎn)業(yè)聯(lián)盟發(fā)布的《2020-2021中國語音產(chǎn)業(yè)發(fā)展白皮書》,2020年我國智能語音市場規(guī)模達(dá)到217億元,同比增長31%。2021年,我國智能語音產(chǎn)業(yè)市場規(guī)模預(yù)計達(dá)到285億元,各種應(yīng)用正在迎來需求拐點,進(jìn)入需求爆發(fā)期,主要立足于日常生活的消費級應(yīng)用場景,市場規(guī)模將超過700億元;而服務(wù)于特定場景的企業(yè)級應(yīng)用場景,由于疫情等原因市場需求正在不斷擴大,預(yù)計將超千億規(guī)模。
隨著賽道的規(guī)模的不斷擴大,智能語音技術(shù)也逐漸趨于成熟。北京市專精特新企業(yè)普強信息技術(shù)(北京)有限公司(下稱「普強」)早在2009年便切入了智能語音賽道,成為當(dāng)前賽道重要的賽車手之一?!钙諒姟故且患乙哉Z音大數(shù)據(jù)分析、智能語音識別、語音合成和自然語言處理技術(shù)為核心的人工智能企業(yè)。業(yè)務(wù)涵蓋了智慧金融、智慧政務(wù)、智能汽車等多個消費級與企業(yè)級應(yīng)用場景,為超過500家企業(yè)提供語音驅(qū)動的人工智能大數(shù)據(jù)解決方案。
進(jìn)入成熟發(fā)展的智能語音
2011年,Siri應(yīng)用到iPhone4s上,通過語音識別等技術(shù)將手機變成了一臺“智能機器人”。智能語音作為人工智能中最成熟的核心技術(shù)之一,被大多數(shù)人認(rèn)為是人工智能的重要入口?!钙諒姟笴PO蒲瑤認(rèn)為,智能語音技術(shù)通過了近十年的研究與發(fā)展,目前已經(jīng)到了成熟期。
從學(xué)術(shù)角度來看,多數(shù)語音技術(shù)已經(jīng)進(jìn)入穩(wěn)步爬升期,智能語音賽道進(jìn)入成熟發(fā)展期。隨著深度學(xué)習(xí)以及大數(shù)據(jù)技術(shù)的不斷發(fā)展,已有的語音識別等智能語音技術(shù)已經(jīng)進(jìn)入生產(chǎn)成熟期,逐步進(jìn)入商業(yè)化應(yīng)用。
不少新興的智能語音技術(shù)如情感人工智能也有了很大程度的進(jìn)步,進(jìn)一步推動了智能語音市場的擴大與商業(yè)化進(jìn)程。
從商業(yè)角度來看,蒲瑤表示:“智能語音現(xiàn)在正處于商業(yè)變現(xiàn)的階段,無論是智能語音公司還是AI公司,都要找到自己的‘賺錢方式’?!奔夹g(shù)的成熟推動了商業(yè)應(yīng)用的落地。
疫情發(fā)生之前,隨著人工智能技術(shù)不斷發(fā)展,智能語音的應(yīng)用場景已經(jīng)在呼叫中心、金融、車載等領(lǐng)域得到應(yīng)用;在疫情帶來的機遇下,無接觸交互需求催生出智能語音更廣泛的應(yīng)用場景和更多落地需求,像:智慧金融、智慧政務(wù)、智慧辦公、智慧旅游等。
?
“定制”的開源技術(shù)適配多場景應(yīng)用
智能語音的產(chǎn)品目前主要以兩種形式呈現(xiàn),分別是行業(yè)解決方案和平臺化技術(shù)輸出。前者是需要深耕垂直領(lǐng)域,對于垂直行業(yè)有深度的認(rèn)知,與企業(yè)進(jìn)行深度合作;后者是通過API(應(yīng)用程序編程入口)等技術(shù)為企業(yè)提供技術(shù)支持,而不少頭部智能語音企業(yè)便是以此切入智能語音賽道。
深耕智能語音賽道13年的「普強」基于自主研發(fā)的語音識別、語義理解、語音合成、大數(shù)據(jù)挖掘等底層AI 技術(shù),以及累計的超過90,000個行業(yè)模型,為金融、教育、大健康等行業(yè)提供“「普強」AI能力平臺”。
以AI能力平臺為基礎(chǔ),「普強」開發(fā)了多款標(biāo)準(zhǔn)化產(chǎn)品。
“‘千尋’實時坐席助手”以實時語音轉(zhuǎn)寫引擎為支撐,通過實時轉(zhuǎn)譯與對話內(nèi)容信息提取,實現(xiàn)實時知識輔導(dǎo)、實時彈屏告警等功能,約束客服行為、提升客戶滿意度。
“‘千尋’離線語音分析系統(tǒng)”基于「普強」多年來累計的大數(shù)據(jù)以及行業(yè)模型,為客戶提供關(guān)鍵詞檢索、數(shù)據(jù)篩選、聚類分析等功能,為企業(yè)提供數(shù)字化運營策略支撐。
擁有底層ASR語音識別引擎能力與非結(jié)構(gòu)化數(shù)據(jù)分析技術(shù)可以為“‘千察’語音質(zhì)檢系統(tǒng)”提供精準(zhǔn)的質(zhì)檢結(jié)果,提高工作效率。
除了可以為企業(yè)提供一站式服務(wù),「普強」AI能力平臺還可以通過API技術(shù)讓企業(yè)進(jìn)行二次開發(fā)。既有了平臺化技術(shù)輸出的普適性,也擁有了行業(yè)解決方案的獨特性。
以智能語音為基石,「普強」的產(chǎn)品涉及了多種應(yīng)用場景。蒲瑤介紹道,“在車載應(yīng)用場景中「普強」也實現(xiàn)了廣泛應(yīng)用,「普強」與世界十大汽車企業(yè)之一的某汽車廠商的合作車輛,已在今年年初實現(xiàn)落地量產(chǎn)?!?/p>
在智慧座艙軟件方面,「普強」擁有自主研發(fā)的全棧語音核心技術(shù),可以為汽車廠商提供“芯+端+云”一體化車載解決方案與定制化的智能網(wǎng)聯(lián)車機系統(tǒng)。軟、硬降噪消回聲技術(shù)、全雙工技術(shù)、實時智能聆聽技術(shù)、離線語音識別、多輪語音交互等功能使智慧駕駛擁有更加流暢的語音交互與APP生態(tài)及操作體驗。
基于「普強」自主研發(fā)的全棧語音核心技術(shù),「普強」還推出了“‘千行意’車載語音助手”,為客戶提供通訊、導(dǎo)航、電臺、娛樂等40+種服務(wù)。通過降噪芯片及算法,除了為客戶提供清晰語音通話外,利用云端的語音識別、語義理解和CP/SP接入,進(jìn)行大數(shù)據(jù)分析、用戶畫像和個性化學(xué)習(xí)后為客戶提供多種應(yīng)用服務(wù)。
「普強」的創(chuàng)始人何國濤自幼在澳門長大,因此帶有澳門“特質(zhì)”的「普強」推出了具有特色的粵語語音識別。粵語承接著古代漢語的許多特點,在詞匯、語法、發(fā)音上都和普通話有明顯區(qū)別。例如,相較于普通話的四個聲調(diào),粵語中擁有完整的九韻六調(diào),這為粵語的語音識別帶來了一定的技術(shù)難度?!啊钙諒姟故禽^早推出粵語智能語音識別的企業(yè),甚至還能識別‘港普’口音”,蒲瑤介紹道。
同時,旅游業(yè)作為澳門的重點發(fā)展行業(yè),「普強」近期也在澳門開展了智慧旅游解決方案。與澳門的美高梅與永利兩大頭部酒店企業(yè)建立合作,通過語音系統(tǒng)與技術(shù)提升酒店行業(yè)運營效率,降低運營成本,實現(xiàn)產(chǎn)業(yè)升級。
?
智能語音生態(tài)不斷升級
據(jù)德勤2021年發(fā)布的《中國智能語音市場分析》,未來智能語音的產(chǎn)業(yè)情境將會以人機交互、技術(shù)輸出、搜索革新和同步信息四個方面體現(xiàn)。蒲瑤認(rèn)為,未來的智能語音會提供兩方面的功能,一是讓生活更加便捷,二是通過人機交互減輕人工的重復(fù)勞動。智能語音交互是大眾接觸科技最普遍的渠道,而隨著語音生態(tài)系統(tǒng)積極合作,智能語音將賦能多形態(tài)智能終端。
而在技術(shù)層面,蒲瑤則認(rèn)為目前已經(jīng)到了一個緩坡的發(fā)展階段,“按之前的規(guī)律大約是10年左右技術(shù)會有一個質(zhì)的飛躍”,目前的智能語音賽道上沒有容易突破的問題,尤其是在自然語言理解方面?!钙諒姟惯x擇了產(chǎn)學(xué)研的發(fā)展路線,與澳門大學(xué)、澳門旅游學(xué)院和澳門科學(xué)技術(shù)發(fā)展基金聯(lián)手打造了粵澳跨境產(chǎn)學(xué)研基地,為未來突破自然語言理解與人機交互難題提供了技術(shù)保障。
同時,智能語音賽道的參與者不斷入局,同質(zhì)化不斷加劇,而競爭也愈演愈烈。如何成為賽道的破局者,形成自己獨有的競爭力,已成為各企業(yè)的無可避免的難題。作為一家專精特新企業(yè),「普強」未來也將繼續(xù)“專”于智能語音賽道,“精”于智能語音產(chǎn)品的精細(xì)制作與快捷易用,以“專精特新”深挖行業(yè)痛點,真正抓住客戶需求,打造「普強」的商業(yè)模式?! ?/p>
評論
查看更多