美國(guó)投資機(jī)構(gòu)Mangrove Capital Partners本周發(fā)布了2019年“語(yǔ)音技術(shù)報(bào)告”。報(bào)告題為“語(yǔ)音:歡迎下一代的顛覆者”,分析了語(yǔ)音助理服務(wù)的日益普及,并對(duì)2020年Siri的動(dòng)向做出了有趣的預(yù)測(cè)。
在過(guò)去多年的鍵盤輸入和點(diǎn)擊手機(jī)屏幕之后,我們正在回歸到最初的“用戶界面”:語(yǔ)音。雖然我們尚未感受到語(yǔ)音技術(shù)帶來(lái)的全部影響,但這種技術(shù)正在改變我們與數(shù)字世界互動(dòng)的方式。
重要的是,這種轉(zhuǎn)變影響的遠(yuǎn)遠(yuǎn)不止是查看天氣預(yù)報(bào),獲取音樂,以及設(shè)置鬧鐘。語(yǔ)音帶來(lái)了平臺(tái)和用戶界面的轉(zhuǎn)變,足以與網(wǎng)頁(yè)和智能手機(jī)相媲美。作為人工智能和機(jī)器學(xué)習(xí)的入口,語(yǔ)音技術(shù)將通過(guò)強(qiáng)大的新方式為我們提供服務(wù)。
在Mangorve,我們相信,語(yǔ)音將成為未來(lái)10年決定性的主題之一。除了用數(shù)字服務(wù)影響各行各業(yè)以外,語(yǔ)音技術(shù)還將培育出新一代的科技公司。與人工智能一起,語(yǔ)音技術(shù)將從根本上改變?nèi)撕蜋C(jī)器的關(guān)系,給下一代軟件創(chuàng)造巨大價(jià)值。
向語(yǔ)音的轉(zhuǎn)移
自2011年蘋果推出Siri以來(lái),語(yǔ)音技術(shù)已經(jīng)取得了長(zhǎng)足發(fā)展。隨著機(jī)器學(xué)習(xí)的發(fā)展,我們?cè)?a href="http://ttokpm.com/tags/語(yǔ)音識(shí)別/" target="_blank">語(yǔ)音識(shí)別(語(yǔ)音轉(zhuǎn)文字)和自然語(yǔ)言處理(識(shí)別文本中的指令)兩方面都獲得了相當(dāng)大的進(jìn)步。事實(shí)上,語(yǔ)音系統(tǒng)的單詞識(shí)別準(zhǔn)確率已超過(guò)95%,這意味著它們已經(jīng)具備了與人類相仿的語(yǔ)言理解能力。相對(duì)于打字,語(yǔ)音產(chǎn)品提供了更自然、更便利、更高效的溝通形式。因此,語(yǔ)音注定將成為最主要的人機(jī)互動(dòng)接口。
根據(jù)Juniper Research的數(shù)據(jù),目前市面上已有25億個(gè)語(yǔ)音助理存在。隨著科技巨頭爭(zhēng)相加入競(jìng)爭(zhēng),越來(lái)越多家庭正在啟用語(yǔ)音服務(wù)。在美國(guó),家用智能音箱的總數(shù)2018年大幅增長(zhǎng)78%,從6670萬(wàn)臺(tái)增加至1.855億臺(tái)。亞馬遜在這個(gè)市場(chǎng)的份額達(dá)到64.6%。Canalys預(yù)計(jì),全球范圍內(nèi)智能音箱的裝機(jī)量到2023年將增長(zhǎng)至5億臺(tái)。
語(yǔ)音也在成為智能家居和物聯(lián)網(wǎng)的入口。亞馬遜宣布,已有4500個(gè)品牌提供2.8萬(wàn)款支持Alexa的智能家居設(shè)備,包括電視機(jī)、炊具和機(jī)器人吸塵器。除了進(jìn)入家庭場(chǎng)景之外,語(yǔ)音助手也在進(jìn)入萬(wàn)豪等酒店的房間,并且在汽車信息娛樂系統(tǒng)中也很受歡迎。亞馬遜正在與多家汽車公司展開談判,有報(bào)道稱亞馬遜的車內(nèi)產(chǎn)品Echo Auto預(yù)售訂單已超過(guò)100萬(wàn)。Echo Auto提供全方位的免提體驗(yàn),包括打電話、導(dǎo)航,以及操控智能家居設(shè)備。
語(yǔ)音技術(shù)也在超越語(yǔ)言障礙。目前谷歌的服務(wù)已經(jīng)支持30種語(yǔ)言,甚至可以同時(shí)理解用戶所說(shuō)的多種語(yǔ)言。有趣的是,在中國(guó)語(yǔ)音服務(wù)的普及更快,阿里巴巴在中國(guó)的智能音箱市場(chǎng)處于領(lǐng)先。
各類受歡迎應(yīng)用的出現(xiàn)令人聯(lián)想到App Store發(fā)展的早期。亞馬遜Alexa提供的功能包括為新媽媽提供母乳喂養(yǎng)支持,鼓勵(lì)孩子們刷牙,幫助用戶鍛煉,指導(dǎo)足球隊(duì),以及指引人們?nèi)绾味\告。
語(yǔ)音電商的崛起
由于亞馬遜Alexa直接關(guān)聯(lián)至全球最大的電商平臺(tái)之一,語(yǔ)音購(gòu)物也在初步發(fā)展。亞馬遜已經(jīng)看到,Alexa平臺(tái)的電商交易在2018年假日季同比增長(zhǎng)至三倍。沃爾瑪近期也推出了基于谷歌語(yǔ)音助手的在線生鮮購(gòu)物服務(wù),支持購(gòu)物者通過(guò)谷歌Home、智能手機(jī)或智能手表將產(chǎn)品添加到購(gòu)物車。
根據(jù)Juniper的數(shù)據(jù),在美國(guó)和英國(guó),語(yǔ)音電商的規(guī)模將從2018年的20億美元增長(zhǎng)至2022年的400億美元。有趣的是,語(yǔ)音電商最熱門的三大商品品類都是低價(jià)商品:生鮮雜貨(20%)、娛樂(19%)和電子(17%)。
因此對(duì)零售商來(lái)說(shuō),獲得“亞馬遜精選”的地位將會(huì)比以往更加重要。根據(jù)OC&C戰(zhàn)略咨詢公司的數(shù)據(jù),亞馬遜購(gòu)物者中有85%最終會(huì)選擇亞馬遜推薦的商品。不過(guò)目前外界仍然不清楚,具體商品要如何才能獲得這樣的推薦。
無(wú)論是在線上還是線下,語(yǔ)音技術(shù)已經(jīng)在指引消費(fèi)者購(gòu)物。快消品廠商正在探索,基于語(yǔ)音體驗(yàn),對(duì)于制作雞尾酒和品嘗威士忌等場(chǎng)景,可以如何提升產(chǎn)品定位和用戶忠誠(chéng)度。
你不會(huì)再感到孤單
重要的是,語(yǔ)音服務(wù)正在從事務(wù)性向?qū)υ捫赞D(zhuǎn)變。這種趨勢(shì)的最終結(jié)果很難完全被理解,但你可以考慮這一點(diǎn):你永遠(yuǎn)不會(huì)再感到孤單,無(wú)論是在與Alexa說(shuō)話,還是與另一個(gè)人或人工智能說(shuō)話。人工智能的第一次浪潮使用算法去建立推薦引擎,提供訪問(wèn)互聯(lián)網(wǎng)服務(wù),例如谷歌、亞馬遜和Facebook的快捷方式。而第二次浪潮則是幫助企業(yè)利用結(jié)構(gòu)化數(shù)據(jù)去優(yōu)化決策流程。類似Palantir的公司開始崛起,它們挖掘大量結(jié)構(gòu)化數(shù)據(jù),找出人眼和人腦難以發(fā)現(xiàn)的信息關(guān)聯(lián)性。
人工智能的第三次浪潮正在到來(lái)。人工智能獲得了眼睛、耳朵和無(wú)數(shù)其他感官,從而可以收集從來(lái)沒有過(guò)的新數(shù)據(jù),隨后使用這些數(shù)據(jù)推動(dòng)更復(fù)雜的流程自動(dòng)化。與此同時(shí),我們也在從基于命令的靜態(tài)流程轉(zhuǎn)向動(dòng)態(tài)流程。這是計(jì)算領(lǐng)域的結(jié)構(gòu)性變化,將徹底改變我們體驗(yàn)軟件,與軟件交互的方式,模糊了數(shù)字世界和現(xiàn)實(shí)世界之間的關(guān)聯(lián)。
隨著人工智能系統(tǒng)在對(duì)話中變得更熟練,收集關(guān)于人們及其周圍世界的更多數(shù)據(jù),它們將可以了解情景信息。人類通??梢圆毁M(fèi)力地掌握這些關(guān)聯(lián)信息,并將其應(yīng)用在對(duì)話中。情景信息將幫助人類和機(jī)器以更自然的方式互動(dòng)和協(xié)作。而隨著體驗(yàn)的優(yōu)化,變得更有用,他們將會(huì)更加頻繁的互動(dòng),而機(jī)器也將掌握更多知識(shí)。
這樣的良性循環(huán)意味著,在未來(lái)3到5年內(nèi),計(jì)算機(jī)的對(duì)話能力將變得更復(fù)雜,更具變革性。與其將我們的時(shí)間花在鍵盤打字和智能手機(jī)觸控上,我們可以很方便地與無(wú)所不在的人工智能交談。重要的是,我們與軟件互動(dòng)的方式將被永久改變:表單將會(huì)消亡,接觸點(diǎn)將變成“監(jiān)聽點(diǎn)”。
這就可以解釋,為何全球最大的科技公司向語(yǔ)音技術(shù)進(jìn)行了大筆投資。語(yǔ)音技術(shù)帶來(lái)了平臺(tái)和用戶界面的改變,這足以媲美此前的網(wǎng)頁(yè)和智能手機(jī),而不同之處僅僅只是,用戶向語(yǔ)音的轉(zhuǎn)移不需要任何訓(xùn)練。對(duì)于這種未來(lái)主導(dǎo)性的平臺(tái),大型科技公司不容有失。因此,亞馬遜已有超過(guò)1萬(wàn)名員工從事Alexa項(xiàng)目,而亞馬遜也是對(duì)語(yǔ)音技術(shù)創(chuàng)業(yè)公司最熱衷的投資方之一。
語(yǔ)音優(yōu)先界面的黎明
語(yǔ)音技術(shù)的影響非常深遠(yuǎn),每家公司都需要重新考慮如何與用戶進(jìn)行互動(dòng)。這不僅僅是調(diào)整SEO(搜索引擎優(yōu)化)等方面的工作,或是開發(fā)自己的Alexa“技能”或谷歌的“操作”。
企業(yè)最終需要提供能感知情景、語(yǔ)音優(yōu)先的界面。能建立用戶認(rèn)知和情感連接的企業(yè)將可以更好地吸引用戶,而如果只是用預(yù)設(shè)腳本去被動(dòng)響應(yīng)用戶問(wèn)題,那么企業(yè)將處于明顯的劣勢(shì)。嚴(yán)重依賴通知去驅(qū)動(dòng)應(yīng)用使用的科技公司可能需要重新審視策略。消費(fèi)者對(duì)于那些用太多通知去打破“聲音門檻”的公司(例如LinkedIn)不會(huì)再有太多耐心。
最熱門的移動(dòng)應(yīng)用成為了今天的主導(dǎo)平臺(tái),而最能吸引用戶的語(yǔ)音優(yōu)先界面將會(huì)成為明天的主導(dǎo)服務(wù)。很難預(yù)測(cè)理想的界面應(yīng)該是什么樣,但下一代Airbnb、Monzo和Uber的出現(xiàn)很可能只要3到5年。
無(wú)屏幕手機(jī),例如Light Phone的出現(xiàn)向我們展示了未來(lái),這樣的手機(jī)不依賴于我們了解并喜愛的移動(dòng)應(yīng)用??紤]到語(yǔ)音服務(wù)的學(xué)習(xí)曲線很短,能明顯減少用戶的使用障礙,因此可以很合理地假設(shè),在我們注意到全部潛力之后,語(yǔ)音經(jīng)濟(jì)將快速發(fā)展。
語(yǔ)音時(shí)代的工作
在我們與軟件交互的過(guò)程中,所花費(fèi)時(shí)間最長(zhǎng)的場(chǎng)景就是工作。因此可以合理假設(shè),在工作場(chǎng)景我們將會(huì)看到最明顯的變化。盡管我們可能仍然需要與屏幕互動(dòng),但鍵盤很可能會(huì)變成多余的。畢竟,普通人每分鐘可以用鍵盤輸入40個(gè)單詞,但卻可以說(shuō)出150個(gè)單詞。
無(wú)所不在的人工智能可以支持我們?nèi)粘9ぷ髦械脑S多任務(wù)和流程,例如回復(fù)電子郵件,整理會(huì)議信息,向團(tuán)隊(duì)成員發(fā)布信息,以及用數(shù)據(jù)更新相關(guān)系統(tǒng)等。這也可能意味著,我們將不再被捆綁在辦公桌,不必再久坐不動(dòng)。
更進(jìn)一步,無(wú)所不在的人工智能可以注意到效率最高的員工,并告知他人他的工作方式,從而優(yōu)化工作產(chǎn)出。能持續(xù)識(shí)別高績(jī)效者的特定策略,并將最佳績(jī)效建議分發(fā)給網(wǎng)絡(luò)中其他人的人工智能學(xué)習(xí)循環(huán)已經(jīng)開始出現(xiàn)。這些優(yōu)化網(wǎng)絡(luò)不是為了取代人工,而是依靠人類去學(xué)習(xí)并優(yōu)化流程。人類仍然會(huì)處于循環(huán)中。
一個(gè)值得關(guān)注的案例是Chorus.ai,該服務(wù)能加入通話,同時(shí)就有效回復(fù)做出提示。Chorus.ai并不是給銷售電話提供預(yù)設(shè)的腳本,而是會(huì)分析團(tuán)隊(duì)成員的不同方法,帶來(lái)更積極的成果,并鼓勵(lì)創(chuàng)造性。
通過(guò)讓人類變得更聰明、更高效,新一代的SaaS(軟件即服務(wù))產(chǎn)品將可以收取更高的訂購(gòu)費(fèi)用,從而成為更具價(jià)值的一代企業(yè)軟件。
從虛擬人物到虛擬醫(yī)生
虛擬KOL莉兒·米克拉(Lil Miquela)
我們已經(jīng)看到,虛擬KOL逐漸興起。例如,來(lái)自洛杉磯、19歲的虛擬KOL莉兒·米克拉(Lil Miquela)在Instagram上積累了150萬(wàn)粉絲,目前已經(jīng)參與過(guò)Calvin Klein等知名時(shí)尚品牌的營(yíng)銷活動(dòng)。
位于舊金山的創(chuàng)意工作室Fable正在虛擬人物方面邁進(jìn)更多一步。該公司的虛擬人物具有完整的互動(dòng)能力,并且有自己的個(gè)性。很快,我們就能創(chuàng)建人工智能全息伴侶,例如《銀翼殺手》中的喬伊。喬伊由Wallace Corp制造,可以成為“你想看到的全部一切”。
虛擬人物很可能會(huì)改變娛樂和客服的表現(xiàn)形式,與此同時(shí)在給老年人和其他需要幫助的人群提供服務(wù)方面也可以扮演關(guān)鍵角色。畢竟,被認(rèn)為孤獨(dú)的人群健康下降的風(fēng)險(xiǎn)要高出59%,而社交孤立也是造成抑郁癥的最常見原因之一。
總部位于巴塞羅那的Safe365作為由科技驅(qū)動(dòng)的社區(qū)和互助網(wǎng)絡(luò)已經(jīng)吸引了許多老年人。語(yǔ)音產(chǎn)品提供了對(duì)用戶非常友好的方式,監(jiān)控健康和認(rèn)知能力,并提供關(guān)于鍛煉和服藥的提醒。
事實(shí)上,語(yǔ)音和人工智能最終有可能完全取代醫(yī)生。K Health已經(jīng)開發(fā)了一款人工智能,將數(shù)千名醫(yī)生的經(jīng)驗(yàn)結(jié)合在一起,以做出準(zhǔn)確的診斷。借助語(yǔ)音技術(shù),人工智能還可以像人類醫(yī)生一樣給病人提供安慰。
對(duì)語(yǔ)音技術(shù)融資的分析
根據(jù)我們的分析,對(duì)語(yǔ)音創(chuàng)業(yè)公司的投資正在加速。語(yǔ)音技術(shù)創(chuàng)業(yè)公司今年已融資7.86億美元,遠(yuǎn)遠(yuǎn)超過(guò)2018年的5.81億美元以及2017年的2.98億美元。這樣的融資增長(zhǎng)表明了市場(chǎng)的信心,即語(yǔ)音技術(shù)將帶來(lái)變革。融資的規(guī)模也在大幅上升,2019年到目前為止平均交易規(guī)模是3000萬(wàn)美元,而2018年和2017年分別為1800萬(wàn)美元和1750萬(wàn)美元。
娛樂和播客是已經(jīng)吸引了大量興趣的領(lǐng)域之一。Spotify收購(gòu)了播客創(chuàng)業(yè)公司Gimlet和Anchor,總共花費(fèi)3.37億美元。這個(gè)領(lǐng)域其他值得關(guān)注的創(chuàng)業(yè)公司還包括制作語(yǔ)音優(yōu)先收費(fèi)內(nèi)容的Sybel。
與此同時(shí),從2015年成立以來(lái),亞馬遜Alexa基金已經(jīng)進(jìn)行了72筆投資。過(guò)去18個(gè)月中,該基金投資的創(chuàng)業(yè)公司涉及娛樂、健康、教育、交通、電商、酒店和SaaS等行業(yè)。這表明,亞馬遜相信語(yǔ)音技術(shù)將改變一系列行業(yè)。
我們的分析還顯示,在語(yǔ)音技術(shù)創(chuàng)業(yè)公司的融資活動(dòng)中,美國(guó)處于領(lǐng)先。美國(guó)此類創(chuàng)業(yè)公司獲得了超過(guò)10億美元的投資,而歐洲只有1.18億美元。這尤其值得關(guān)注,因?yàn)檎Z(yǔ)音技術(shù)代表著范式轉(zhuǎn)換。如果歐洲希望在下一代技術(shù)發(fā)展中建立自己的地位,歐洲的創(chuàng)業(yè)者和投資人需要快速做出響應(yīng)。
挑戰(zhàn)
語(yǔ)音技術(shù)領(lǐng)域最大的挑戰(zhàn)之一是隱私保護(hù)。微軟的數(shù)據(jù)顯示,41%的語(yǔ)音助手用戶對(duì)信任、隱私和被動(dòng)監(jiān)聽感到擔(dān)憂。谷歌Nest設(shè)備中被發(fā)現(xiàn)存在隱藏的麥克風(fēng)造成了不利影響,而亞馬遜申請(qǐng)專利“監(jiān)聽房間里的所有對(duì)話”也是如此。
如何回應(yīng)這些關(guān)切取決于科技公司,而蘋果在這方面的工作卓有成效。蘋果收購(gòu)Silk Labs值得贊賞,后者開發(fā)在設(shè)備中運(yùn)行的人工智能軟件,而不必使用云計(jì)算平臺(tái)去處理數(shù)據(jù)。
蘋果在圍繞語(yǔ)音服務(wù)構(gòu)建生態(tài)方面進(jìn)展緩慢。實(shí)際上,蘋果1987年提出的“知識(shí)導(dǎo)航工具”給出了更明確的語(yǔ)音服務(wù)愿景。語(yǔ)音服務(wù)社區(qū)期望蘋果在2020年全球開發(fā)者大會(huì)(WWDC)上為開發(fā)者社區(qū)發(fā)布Siri操作系統(tǒng),從而加速創(chuàng)新和普及。
Voicebot.ai的編輯和出版人布雷特·金塞拉(Bret Kinsella)表示:“Siri操作系統(tǒng)對(duì)于鼓勵(lì)創(chuàng)新是有必要的。許多人認(rèn)為,蘋果需要匹配亞馬遜和谷歌語(yǔ)音助手取得的進(jìn)展?!?/p>
《機(jī)械姬》等熱門電影中提出的一個(gè)問(wèn)題是,如果我們癡迷于機(jī)器人,愛上代碼而不是其他人,那么人工智能將成為人類的威脅。盡管對(duì)某些人來(lái)說(shuō)這種說(shuō)法聽起來(lái)很牽強(qiáng),但約會(huì)模擬游戲已被證明非常受歡迎。在中國(guó),名為《戀與制作人》的游戲在上線首個(gè)月下載量突破700萬(wàn)。
盡管挑戰(zhàn)了我們對(duì)隱私保護(hù)的觀念,就人類與技術(shù)的關(guān)系提出了新問(wèn)題,但我們?nèi)匀挥泻芏嗬碛蓪?duì)語(yǔ)音技術(shù)保持樂觀。這種技術(shù)將驅(qū)動(dòng)新的生產(chǎn)力提升浪潮,造福消費(fèi)者、企業(yè)和社會(huì)。并且,這也將幫助我們更好地照料老年人,同時(shí)讓全球7.74億不識(shí)字的人群可以使用互聯(lián)網(wǎng)。
語(yǔ)音時(shí)代的預(yù)測(cè)
鍵盤的消亡:我們不再需要打字,而是可以使用語(yǔ)音和手勢(shì)。鍵盤將在未來(lái)5到10年內(nèi)基本上消亡。
語(yǔ)音技術(shù)將帶來(lái)全新的產(chǎn)品門類,包括無(wú)屏幕智能手機(jī)。
品牌很快需要通過(guò)“聲音身份”來(lái)被識(shí)別,產(chǎn)品搜索將被徹底改變。
因?yàn)樵谑褂谜Z(yǔ)音服務(wù)時(shí)用戶不太能注意到具體應(yīng)用,因此硬件將重新變得比軟件更重要。
虛擬伴侶將變成現(xiàn)實(shí),滿足你生活的全部需求。
蘋果將于2020年推出Siri操作系統(tǒng),從而在語(yǔ)音經(jīng)濟(jì)中推動(dòng)巨大的創(chuàng)新。到2025年,語(yǔ)音經(jīng)濟(jì)的規(guī)模將達(dá)到1萬(wàn)億美元,超過(guò)移動(dòng)應(yīng)用經(jīng)濟(jì)。
-
人工智能
+關(guān)注
關(guān)注
1789文章
46652瀏覽量
237060 -
人機(jī)互動(dòng)
+關(guān)注
關(guān)注
0文章
41瀏覽量
14634 -
語(yǔ)音助理
+關(guān)注
關(guān)注
0文章
27瀏覽量
8666
原文標(biāo)題:2019語(yǔ)音技術(shù)報(bào)告:語(yǔ)音經(jīng)濟(jì)規(guī)模將超移動(dòng)應(yīng)用
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論