久久精品九九亚洲精品,国产高清精品福利私拍国产

2017 年可以看做是智能語(yǔ)音交互的元年，在這一年里小愛(ài)同學(xué)、天貓精靈紛紛上市。2018 年里語(yǔ)音交互的落地突然加速，落地的產(chǎn)品從大公司關(guān)注的智能音箱擴(kuò)展到其它品類，比如電視盒子、鬧鐘、燈、智能馬桶等。那接下來(lái)語(yǔ)音交互會(huì)如何發(fā)展？

▌?wù)Z音交互的終極目標(biāo)

語(yǔ)音交互的便利程度正好與人工智能的發(fā)展程度成正比，智能程度越高語(yǔ)音交互的等級(jí)也就越高，所以其終極形態(tài)與人工智能的終極形態(tài)類似。

如果拋棄特別夸張的想象來(lái)說(shuō)，那語(yǔ)音交互要能達(dá)成《她》或者《黑鏡》里描述的樣子：

當(dāng)你輸入數(shù)據(jù)給它后，它能夠根據(jù)輸入數(shù)據(jù)表現(xiàn)出不同的個(gè)性。

在數(shù)據(jù)的處理上它近乎是全能的，只受個(gè)人權(quán)限的限制。

如果真的賦予實(shí)體，那它可以感知周圍環(huán)境并作出與人類似但很多方面會(huì)更優(yōu)秀的反應(yīng)。

今天的智能音箱和未來(lái)相對(duì)終極的語(yǔ)音交互方式以及設(shè)備相比，其差距要遠(yuǎn)大于 X86 電腦和今天 Pad 的差距。

一旦發(fā)展成以上這樣的程度，那語(yǔ)音交互就會(huì)徹底地打開(kāi)邊界，而不只是我們使用數(shù)據(jù)的一種方式，甚至?xí)蔀樯畹谋仨毱贰Ｎ覀儾粫?huì)對(duì) iPhone 產(chǎn)生依戀，但語(yǔ)音交互則會(huì)。

回顧下《黑鏡》里描述的場(chǎng)景，可以對(duì)此有更好的理解：

女主人公的丈夫去世，過(guò)于思念自己丈夫的女主人公通過(guò)公開(kāi)的自己丈夫的數(shù)據(jù)創(chuàng)建了一個(gè)有性格的，屬于自己的語(yǔ)音交互機(jī)器人。這個(gè)機(jī)器人在絕大多數(shù)方面表現(xiàn)和女主丈夫一致。女主使用一段時(shí)間后，就升級(jí)了這服務(wù)，為這語(yǔ)音交互機(jī)器人賦予了和自己丈夫一樣的形體。

這看著非?？苹?，但實(shí)際上一旦語(yǔ)音交互達(dá)到上述程度，那這類事情幾乎一定發(fā)生。既然我們能接受很宅并愿意躲在家里，那就一定能接受這樣一種非真實(shí)、但更完美的電子助手進(jìn)入心靈的世界?！端愤@部電影雖然沒(méi)拍，但如果有為個(gè)性化語(yǔ)音交互系統(tǒng)塑形的服務(wù)，主人公也一定會(huì)接受。

在這里反倒是互聯(lián)網(wǎng)限制了我們的想象力，因?yàn)榛ヂ?lián)網(wǎng)更多體現(xiàn)的只是工具的屬性，但實(shí)際上語(yǔ)音交互系統(tǒng)所涵蓋的范圍要比互聯(lián)網(wǎng)大的多。當(dāng)前之所以能做的還不多，主要是層級(jí)還不夠。

▌?wù)Z音交互的L1、L2、L3

我們可以這樣定義語(yǔ)音交互的 L1 階段：

能以極高的準(zhǔn)確率，在典型的環(huán)境下響應(yīng)用戶的語(yǔ)音輸入。極高的準(zhǔn)確率最低應(yīng)該在 90%+。這時(shí)承載語(yǔ)音交互的設(shè)備主要負(fù)責(zé)功能性的提示與反饋（燈與屏幕等）。

當(dāng)前所有與語(yǔ)音相關(guān)的公司，事實(shí)上都是在達(dá)成 L1 的路上。L1 的出口為語(yǔ)音交互習(xí)慣徹底樹(shù)立，人們面對(duì)每款設(shè)備的時(shí)候會(huì)首先想到用語(yǔ)音操作，而不是遙控器或者屏幕。

在 L1 階段語(yǔ)音交互更像是自動(dòng)化程度、精準(zhǔn)程度更高的搜索，但搜索的范圍擴(kuò)大了，不單是局限于已有的數(shù)字內(nèi)容，也擴(kuò)展到家電、視頻通話等正常搜索不會(huì)覆蓋的領(lǐng)域。

我們可以這樣定義 L2 階段：

能以極高的準(zhǔn)確率識(shí)別出交互的當(dāng)事人和環(huán)境，然后進(jìn)行個(gè)性化的交互。這時(shí)承載語(yǔ)音交互的設(shè)備通過(guò)攝像頭等傳感器能夠?qū)崟r(shí)感知，進(jìn)行適當(dāng)移動(dòng)，初步擬人。

L2 階段體現(xiàn)的是個(gè)性化，不再是千人一面。如果 L2 得以達(dá)成，那《她》所描述的場(chǎng)景是可以實(shí)現(xiàn)的。語(yǔ)音交互可以定制出性格，而這種性格很可能確實(shí)滿足某個(gè)人的心理期待。

在 L2 階段，語(yǔ)音交互會(huì)打破工具的邊界，嘗試走入從來(lái)沒(méi)被搜索等介入的領(lǐng)域，比如排遣寂寞?，F(xiàn)在的各種 App 是按照領(lǐng)域來(lái)切分的，而在 L2 階段，所有 App 的邊界會(huì)被打破，信息的輸出是按照人來(lái)切分的。也就是說(shuō)不再有 BAT、頭條、美團(tuán)等，只有張三的語(yǔ)音交互助理，李四的語(yǔ)音交互助理。

我們可以這樣定義 L3 階段：

只要有數(shù)據(jù)，語(yǔ)音交互系統(tǒng)的能力就可以無(wú)邊界擴(kuò)展（包括個(gè)性和能力）。交互設(shè)備可以進(jìn)行擬人化輸出。

L3 階段體現(xiàn)的是后端內(nèi)容擴(kuò)展的無(wú)邊界特性，不再是有多少智能就有多少人工，以及擬人化輸出。擬人化輸出包括移動(dòng)、說(shuō)話的語(yǔ)調(diào)、風(fēng)格、姿態(tài)等。

如果 L3 階段得以實(shí)現(xiàn)，那《黑鏡》描述的場(chǎng)景是可以實(shí)現(xiàn)的。只要有一個(gè)人充分的數(shù)據(jù)描述，就可以立刻模擬這個(gè)人，然后賦予他一個(gè)真實(shí)的身體。

在 L3 階段，語(yǔ)音交互及其載體，將是社會(huì)生活、甚至家庭的一部分。

本質(zhì)上，從 L1 到 L3 體現(xiàn)的是數(shù)字化和智能程度不斷加深，同時(shí)數(shù)字和智能又按照人類的理想形態(tài)進(jìn)行物化的過(guò)程。這一過(guò)程也是完全顛覆基于手機(jī)的移動(dòng)互聯(lián)網(wǎng)的過(guò)程。

▌?wù)Z音交互發(fā)展的核心障礙

整個(gè)行業(yè)迫切需要徹底解決下面的問(wèn)題：

解決前端聲學(xué)適配問(wèn)題，否則變成每個(gè)設(shè)備都需要調(diào)整，但真正能對(duì)其調(diào)整的人員很少。

NLP 整合足夠全的內(nèi)容資源，開(kāi)發(fā)出缺省的 Killer App，因?yàn)楫a(chǎn)品公司不可能系統(tǒng)地在產(chǎn)品周期內(nèi)整合所有內(nèi)容。

落地方式多樣化（包括純軟件、模組的）。語(yǔ)音交互和移動(dòng)應(yīng)用的根本不同是需要面對(duì)多種多樣的設(shè)備，所以其自身的落地形態(tài)必須是靈活的。

眼下不同產(chǎn)品公司的訴求差別很大，小公司希望的是 turn-key 的方案，有內(nèi)容的公司希望的是自己做部分 NLP，偏行業(yè)的公司希望的是有帶硬件可貼牌的產(chǎn)品、但自己開(kāi)發(fā)手機(jī) App，諸如此類。

因?yàn)橛脩粜枨蟮膹?fù)雜性，落地是一個(gè)相對(duì)長(zhǎng)跑且需要保持靈活的過(guò)程，不同產(chǎn)品公司需求的內(nèi)核是一樣的，但處理大品牌客戶總是需要靈活處理很多細(xì)節(jié)。這對(duì)于創(chuàng)業(yè)公司難度不大，但對(duì)巨頭會(huì)形成難以跨越的障礙。

▌未來(lái)三年必然會(huì)達(dá)成的成績(jī)

現(xiàn)在與語(yǔ)音交互相關(guān)的公司，核心在做的就是 L1 階段的事。這個(gè)階段雖然在人工智能的大趨勢(shì)里面，但本質(zhì)上智能并沒(méi)那么關(guān)鍵，關(guān)鍵的是便利以及能輸出的內(nèi)容。這兩者會(huì)推動(dòng)樹(shù)立語(yǔ)音交互這種習(xí)慣。

如果要在數(shù)量級(jí)上進(jìn)行判斷的話，那三年后可以達(dá)成的目標(biāo)是：

每年有 10 億臺(tái)支持語(yǔ)音交互的設(shè)備售出。

至少故事機(jī)、電視機(jī)、電視盒子、汽車前后裝、白色家電、燈、鬧鐘等會(huì)加入這種特性。手機(jī)、Pad、電腦這些大品類上語(yǔ)音交互的能力則會(huì)變成標(biāo)配，但使用頻次估計(jì)需要更長(zhǎng)的時(shí)間進(jìn)行提升。在最初，交互頻次會(huì)很差（這點(diǎn)在前文已提及），語(yǔ)音交互本身并非一種獨(dú)立的交互方式，而是同其背后的內(nèi)容深度綁定，我們很多的應(yīng)用實(shí)際上是針對(duì)手機(jī)和鍵盤鼠標(biāo)操作優(yōu)化過(guò)的。

凡是電子設(shè)備都可以用語(yǔ)音來(lái)進(jìn)行交互。

語(yǔ)音交互不會(huì)挑設(shè)備，同之前的交互相比，它可以更加低廉，理論上只要麥克風(fēng)并且能聯(lián)網(wǎng)就足夠了。相較于給設(shè)備加入鍵盤鼠標(biāo)或者屏幕，這個(gè)成本要低很多。這點(diǎn)上做出表率的仍然是亞馬遜，亞馬遜不停地推出新的設(shè)備，如微波爐、車載設(shè)備等。當(dāng)然不同設(shè)備上語(yǔ)音交互的層次是不同的，有些設(shè)備如白色家電，語(yǔ)音交互會(huì)限制在一到三輪以內(nèi)。

在更高一級(jí)的視角下，當(dāng)前的所有努力本質(zhì)作用就一個(gè)：通過(guò)便利性樹(shù)立語(yǔ)音交互的習(xí)慣。但是，習(xí)慣背后跟隨的是用戶時(shí)間，二者又會(huì)為下面的進(jìn)一步發(fā)展提供試驗(yàn)田。只有達(dá)成了這一目標(biāo)，從技術(shù)到產(chǎn)品再到用戶這一循環(huán)才算真正完成了第一次迭代。

▌結(jié)語(yǔ)

語(yǔ)音交互看著太簡(jiǎn)單了，不過(guò)是說(shuō)話而已，所以很容易被誤解為，像說(shuō)話一樣的交互就是現(xiàn)在語(yǔ)音交互設(shè)備所應(yīng)該能干的事。其實(shí)不是，語(yǔ)音交互的從 L1 到 L3 有可能比自動(dòng)駕駛從 L1 到 L5 還要漫長(zhǎng)。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

人工智能

人工智能

+關(guān)注

關(guān)注
1787

文章
46061

瀏覽量
235006
語(yǔ)音交互

語(yǔ)音交互

+關(guān)注

關(guān)注
3

文章
281

瀏覽量
27913

原文標(biāo)題：語(yǔ)音交互只是說(shuō)話？相比自動(dòng)駕駛它還在L1級(jí)！

文章出處：【微信號(hào)：rgznai100，微信公眾號(hào)：rgznai100】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

FPGA在自動(dòng)駕駛領(lǐng)域有哪些優(yōu)勢(shì)?

。硬件級(jí)安全： 自動(dòng)駕駛系統(tǒng)對(duì)安全性有極高的要求。FPGA的硬件級(jí)安全性使其能夠在硬件層面實(shí)現(xiàn)數(shù)據(jù)加密、防篡改和防攻擊等安全功能，確保自動(dòng)駕駛系統(tǒng)的穩(wěn)定運(yùn)行和數(shù)據(jù)安全。易于集成

發(fā)表于 07-29 17:11

FPGA在自動(dòng)駕駛領(lǐng)域有哪些應(yīng)用？

FPGA（Field-Programmable Gate Array，現(xiàn)場(chǎng)可編程門陣列）在自動(dòng)駕駛領(lǐng)域具有廣泛的應(yīng)用，其高性能、可配置性、低功耗和低延遲等特點(diǎn)為自動(dòng)駕駛的實(shí)現(xiàn)提供了強(qiáng)有力的支持。以下

發(fā)表于 07-29 17:09

自動(dòng)駕駛步入L3階段磁性元器件行業(yè)有何新機(jī)遇？

車企進(jìn)入上述名單，拿到了L3級(jí)自動(dòng)駕駛試點(diǎn)的“入場(chǎng)券”，自動(dòng)駕駛市場(chǎng)正式步入了一個(gè)全新的發(fā)展階段。近年來(lái)，

發(fā)表于 07-17 09:29 ?254次閱讀

<b class='flag-5'>自動(dòng)駕駛</b>步入<b class='flag-5'>L</b>3<b class='flag-5'>階段</b> 磁性元器件行業(yè)有何新機(jī)遇？

Mobileye引領(lǐng)自動(dòng)駕駛新紀(jì)元:L4級(jí)無(wú)人駕駛系統(tǒng)在德國(guó)成功路測(cè)

在全球自動(dòng)駕駛技術(shù)的浪潮中，Mobileye，作為全球自動(dòng)駕駛解決方案的領(lǐng)軍者，再次邁出了具有里程碑意義的一步。近日，該公司宣布其全自動(dòng)無(wú)人駕駛系統(tǒng)（即

發(fā)表于 07-02 17:04 ?1246次閱讀

工信部完成自動(dòng)駕駛試點(diǎn)申報(bào) 長(zhǎng)安汽車成L3級(jí)智能試點(diǎn)單位

上路的政策支持有了進(jìn)一步的支撐。 ? ? ? ?據(jù)悉；試點(diǎn)的組織實(shí)施共分為五個(gè)階段，分別是試點(diǎn)申報(bào)、產(chǎn)品準(zhǔn)入試點(diǎn)、上路通行試點(diǎn)、試點(diǎn)暫停與退出、評(píng)估調(diào)整。當(dāng)前，只是完成試點(diǎn)申報(bào)階段的遴選，并不代表具有

發(fā)表于 06-05 19:00 ?1384次閱讀

駛向L3級(jí)自動(dòng)駕駛：車路協(xié)同

，遴選具備量產(chǎn)條件的L3及L4級(jí)別自動(dòng)駕駛汽車開(kāi)展準(zhǔn)入試點(diǎn)，大大推進(jìn)了進(jìn)入L3級(jí)

發(fā)表于 05-20 11:16 ?403次閱讀

駛向<b class='flag-5'>L</b>3<b class='flag-5'>級(jí)</b><b class='flag-5'>自動(dòng)駕駛</b>：車路協(xié)同

百度發(fā)布全球首個(gè)L4級(jí)自動(dòng)駕駛大模型

近日，百度Apollo宣布了全球首個(gè)支持L4級(jí)自動(dòng)駕駛的大模型Apollo ADFM（Autonomous Driving Foundation Model）。這一突破性的技術(shù)成果，標(biāo)志著自動(dòng)

發(fā)表于 05-17 09:58 ?335次閱讀

未來(lái)已來(lái)，多傳感器融合感知是自動(dòng)駕駛破局的關(guān)鍵

的Robotaxi運(yùn)營(yíng)。這標(biāo)志著L4級(jí)自動(dòng)駕駛迎來(lái)了新的里程碑，朝著商業(yè)化落地邁進(jìn)了一大步。中國(guó)的車企也不甘落后：4月7日，廣汽埃安與滴滴自動(dòng)駕駛宣布合資公司——廣州安滴科技有限公司獲

發(fā)表于 04-11 10:26

NVIDIA和昊鉑宣布雙方將合作量產(chǎn)L4級(jí)自動(dòng)駕駛汽車

北京時(shí)間3月19日，在NVIDIA GTC大會(huì)上，NVIDIA和昊鉑宣布雙方將合作量產(chǎn)L4級(jí)自動(dòng)駕駛汽車。

發(fā)表于 03-20 15:06 ?692次閱讀

百舸爭(zhēng)流之勢(shì)！L3級(jí)自動(dòng)駕駛進(jìn)入路測(cè)階段

2023年底，政策層面給L3級(jí)自動(dòng)駕駛的商業(yè)化落地填了一把助燃劑，可以說(shuō)對(duì)智能駕駛給出了“天高任鳥(niǎo)飛”般的擁抱態(tài)度。

發(fā)表于 03-04 14:10 ?441次閱讀

自動(dòng)駕駛產(chǎn)業(yè)鏈爆發(fā)前夜？多家車企宣布已獲得L3級(jí)自動(dòng)駕駛路測(cè)牌照

工信部網(wǎng)站信息顯示，2022年11月，工信部發(fā)布《關(guān)于開(kāi)展智能網(wǎng)聯(lián)汽車準(zhǔn)入和上路通行試點(diǎn)工作的通知（征求意見(jiàn)稿）》，針對(duì)搭載中國(guó)國(guó)家標(biāo)準(zhǔn)（GB/T 40429-2021）定義的L3級(jí)（有條件自動(dòng)駕駛）/

發(fā)表于 12-27 17:09 ?849次閱讀

語(yǔ)音數(shù)據(jù)集在自動(dòng)駕駛中的應(yīng)用與挑戰(zhàn)

隨著人工智能技術(shù)的快速發(fā)展，自動(dòng)駕駛汽車已經(jīng)成為交通領(lǐng)域的研究熱點(diǎn)。語(yǔ)音數(shù)據(jù)集在自動(dòng)駕駛中發(fā)揮著重要的作用，為駕駛員和乘客提供了更加便捷和安全的交互

發(fā)表于 12-25 09:48 ?417次閱讀

LabVIEW開(kāi)發(fā)自動(dòng)駕駛的雙目測(cè)距系統(tǒng)

LabVIEW開(kāi)發(fā)自動(dòng)駕駛的雙目測(cè)距系統(tǒng) 隨著車輛駕駛技術(shù)的不斷發(fā)展，自動(dòng)駕駛技術(shù)正日益成為現(xiàn)實(shí)。從L2級(jí)別的輔助

發(fā)表于 12-19 18:02

L1輔助駕駛到L4自動(dòng)駕駛的五個(gè)示例系統(tǒng)

下面分別介紹從L1輔助駕駛到L4自動(dòng)駕駛的五個(gè)示例系統(tǒng)。? ? ? ? ?超低端系統(tǒng) 該系統(tǒng)代表一個(gè)示例性感知器配置，包含一個(gè)攝像頭（1x3

發(fā)表于 10-04 10:57 ?633次閱讀

自動(dòng)駕駛標(biāo)準(zhǔn)與認(rèn)證研究：標(biāo)準(zhǔn)化體系助力高階自動(dòng)駕駛落地和汽車出海

自動(dòng)駕駛標(biāo)準(zhǔn)的建設(shè)具有前瞻性和約束性，對(duì)國(guó)家自動(dòng)駕駛汽車發(fā)展具有深遠(yuǎn)的意義，目前自動(dòng)駕駛標(biāo)準(zhǔn)主要圍繞L3級(jí)及以上

發(fā)表于 09-27 16:15 ?1134次閱讀