人機(jī)交互的前世今生
自從人類發(fā)明了計(jì)算機(jī),就持續(xù)面臨著一個(gè)問(wèn)題:我們到底應(yīng)該如何與機(jī)器交互?
在計(jì)算機(jī)的發(fā)展歷史上,隨著技術(shù)的進(jìn)步,發(fā)生過(guò)幾次大的交互模式的演進(jìn):近年來(lái)的轉(zhuǎn)變大致可以概括為以鼠標(biāo)/鍵盤為主的交互模式轉(zhuǎn)換為以觸摸和語(yǔ)音為主的交互模式。
由此,我們可以預(yù)測(cè)人機(jī)交互的發(fā)展趨勢(shì),主要體現(xiàn)在:
交互理念方面,機(jī)器從被動(dòng)接受信息到主動(dòng)理解信息,以及從滿足基本功能到強(qiáng)調(diào)用戶體驗(yàn);
交互設(shè)備方面,機(jī)器輸入、輸出的方式更加自然化、內(nèi)容多樣化。
顯然,不管是理念的轉(zhuǎn)變還是設(shè)備的升級(jí),我們和機(jī)器的交互方式上經(jīng)歷了一個(gè)從人適應(yīng)機(jī)器,到機(jī)器適應(yīng)人的過(guò)程。
語(yǔ)音交互解決人機(jī)交互痛點(diǎn)
語(yǔ)言是什么?是人類最牛逼的發(fā)明,是人類進(jìn)化的產(chǎn)物。
人類通過(guò)語(yǔ)言,能夠把對(duì)世界的理解,想傳遞的信息,壓縮成一串很短的文字輸入給對(duì)方,對(duì)方聽完以后,能根據(jù)這些文字,還原事件、圖像,以及情感。
鼠標(biāo)/鍵盤本質(zhì)上不是一種交互方式,而是一種輸入設(shè)備,真正的交互方式其實(shí)是以語(yǔ)言為載體的“命令”。
正如微軟創(chuàng)始人比爾?蓋茨如所言:“人類自然形成的與自然界溝通的認(rèn)知習(xí)慣和形式必定是人機(jī)交互的發(fā)展方向”。
隨著人工智能技術(shù)的發(fā)展,自然語(yǔ)言交互必定是實(shí)現(xiàn)“命令自然化”的關(guān)鍵突破口。語(yǔ)言聲學(xué)技術(shù)為人機(jī)交互注入了智能屬性,交互不再是精確的“指令”。
在上世紀(jì)出現(xiàn)Google、百度等搜索引擎的時(shí)候,交互還是單向的,但出現(xiàn)智能手機(jī)之后我們的交互變成了雙向。比如蘋果的交互史,在剛開始做出來(lái)第一代iPhone的時(shí)候并沒(méi)有語(yǔ)音交互的能力,但經(jīng)過(guò)市場(chǎng)調(diào)研之后發(fā)現(xiàn)有75%的用戶都希望有語(yǔ)音控制。于是,在后面兩代iPhone加入了語(yǔ)音控制,但到后面發(fā)現(xiàn)實(shí)際使用的用戶竟然不到5%,蘋果經(jīng)過(guò)總結(jié)之后發(fā)現(xiàn)不僅僅是語(yǔ)音,還必須有自然語(yǔ)言交互。
正如我們對(duì)自然語(yǔ)言處理技術(shù)的應(yīng)用場(chǎng)景的想象,關(guān)鍵在于足夠自然,人工智能永遠(yuǎn)都在追趕最高的自然智能。
信息文明走向智能文明 ,機(jī)器需適應(yīng)人類的自然語(yǔ)言體系,然后完成任務(wù)。
語(yǔ)音識(shí)別+聲紋識(shí)別:人機(jī)交互這么做就對(duì)了!
以智能音箱為例,需要其不再是基于幾個(gè)關(guān)鍵詞來(lái)反饋結(jié)果,而是能夠理解用戶的語(yǔ)言指令,完成一項(xiàng)完整的任務(wù)。
一方面,語(yǔ)音交互將使智能音箱跳出了傳統(tǒng)的“命令式交互系統(tǒng)”,你可以說(shuō)“為我播放一首爵士樂(lè)”、“為我查一下明天的天氣”等這類不再精確的指令。機(jī)器擁有理解人類語(yǔ)言、分析語(yǔ)言意圖,進(jìn)行更多的決策的可能。
另一方面,語(yǔ)音技術(shù)的進(jìn)展使得我們可以遠(yuǎn)距離控制設(shè)備。在移動(dòng)互聯(lián)網(wǎng)時(shí)代,用戶需要更為方便自然的人機(jī)交互方式。當(dāng)互聯(lián)網(wǎng)從個(gè)人電腦向移動(dòng)終端遷移,人們?cè)谧呗?、開車、吃飯時(shí)都可以通過(guò)互聯(lián)網(wǎng)獲取信息、完成任務(wù),語(yǔ)音交互的非接觸性,解放了雙手,成為了快捷方便的方式。
“萬(wàn)物互聯(lián)”時(shí)代下的人機(jī)交互:以用戶為中心,使產(chǎn)品主動(dòng)為受眾的提供服務(wù)
隨著5G的發(fā)展和互聯(lián)網(wǎng)技術(shù)的不斷成熟,人類已經(jīng)進(jìn)入到了一個(gè)萬(wàn)物互聯(lián)的“大連接”時(shí)代,“大連接”的目的是為了讓人類的生活更加美好,更加便利。
設(shè)備被賦予的大量連接,連接為交互建立了通道。交互通道建立后的下一步,是用人工智能技術(shù)為“大連接”時(shí)代賦能。
語(yǔ)音交互遠(yuǎn)距離控制的特性,極大地增加了可交互設(shè)備的數(shù)量,有利于智能設(shè)備的快速普及。
在未來(lái)全面智能化、萬(wàn)物互聯(lián)的生活中,真實(shí)使用場(chǎng)景總是有多個(gè)聲源和環(huán)境噪聲疊加,比如經(jīng)常會(huì)出現(xiàn)周邊噪聲干擾和多人同時(shí)說(shuō)話的場(chǎng)景。
想象一下,如果所有的智能設(shè)備都在同一時(shí)間點(diǎn)被觸發(fā),“隨意”的為用戶展示信息,身處其中的大家可能會(huì)立刻瘋掉。這時(shí)候,用聲紋識(shí)別技術(shù)讓智能設(shè)備可以識(shí)別“主人身份”就顯得格外重要(語(yǔ)音識(shí)別是識(shí)別你說(shuō)的話,而聲紋識(shí)別是指識(shí)別說(shuō)話的人是誰(shuí))。未來(lái)更多的智能設(shè)備上面將配有聲紋識(shí)別,更將大大的提高設(shè)備的安全性。
快商通聲紋識(shí)別:讓智能設(shè)備認(rèn)識(shí)你,聽懂你
以前的語(yǔ)音交互大多是服務(wù)為主,以產(chǎn)品為核心,是根據(jù)產(chǎn)品找用戶。
目前,作為聲紋身份認(rèn)證與智能語(yǔ)音交互解決方案提供商,快商通推出以用戶為中心的智能交互解決方案:
通過(guò)遠(yuǎn)場(chǎng)聲紋識(shí)別技術(shù),讓智能設(shè)備能夠自然快速識(shí)別用戶身份,從而時(shí)刻感知用戶需求的本質(zhì)來(lái)源,記憶用戶行為習(xí)慣和各類偏好。通過(guò)自然語(yǔ)言交互,分析用戶語(yǔ)言背后的真實(shí)意圖,并隨之快速作出合理的反應(yīng),并能在之后的生活中不斷地進(jìn)行調(diào)整。
方案集成聲紋識(shí)別、聲學(xué)處理、自然語(yǔ)言處理、深度神經(jīng)網(wǎng)絡(luò)等核心AI智能技術(shù),以唯一性和安全性為基礎(chǔ),打造“人性化”的人機(jī)交互,解決智能設(shè)備的誤觸發(fā)及個(gè)性化服務(wù)痛點(diǎn):
快商通原創(chuàng)的語(yǔ)音與聲學(xué)處理技術(shù)能夠保證機(jī)器能夠聽得準(zhǔn)真實(shí)環(huán)境下人的聲音,使智能設(shè)備在充滿噪聲干擾和多人同時(shí)說(shuō)話的場(chǎng)景中,仍然能保持95%以上的識(shí)別準(zhǔn)確率,同時(shí)處理多人聲紋身份識(shí)別的問(wèn)題。
智能設(shè)備們除了能只被特定成員喚醒外,還能根據(jù)不同成員的習(xí)慣和喜好進(jìn)行個(gè)性化推薦。唯有你能在你的整個(gè)智能生活的中心隨心所欲。
快商通是一家以人工智能技術(shù)為核心的創(chuàng)新型科技公司,專注于聲紋識(shí)別與自然語(yǔ)言處理技術(shù)的研發(fā)與創(chuàng)新,完全自主知識(shí)產(chǎn)權(quán)的聲紋識(shí)別技術(shù)達(dá)到世界領(lǐng)先水平。
目前,快商通已為大量終端設(shè)備廠商提供優(yōu)質(zhì)的遠(yuǎn)場(chǎng)聲紋識(shí)別與語(yǔ)義理解技術(shù)支持。用戶可在不同場(chǎng)景下通過(guò)遠(yuǎn)場(chǎng)語(yǔ)音交互。進(jìn)行自然語(yǔ)言交互,享受科技給生活帶來(lái)的便利。未來(lái),將攜手人工智能生態(tài)鏈上下游合作伙伴,持續(xù)推進(jìn)更自然、更智能、更人性化的人機(jī)交互發(fā)展,讓人工智能更好的服務(wù)人類。
快商通技術(shù)方案優(yōu)勢(shì):
1.復(fù)雜場(chǎng)景下的身份識(shí)別與喚醒:結(jié)合聲源定位和前端聲學(xué)處理技術(shù),解決誤觸發(fā),交互過(guò)程自然高效。
2.深層次理解:結(jié)合場(chǎng)景、世界知識(shí)和歷史交互信息,再對(duì)語(yǔ)義、語(yǔ)用和情感進(jìn)行深層次理解,提升能交互效率和機(jī)器決策準(zhǔn)確度。
3.擬人式對(duì)話:在系統(tǒng)的輸出側(cè),能夠以高逼真度、高自然度、和高準(zhǔn)確度度的擬人形象、用詞、和表達(dá)方式來(lái)和用戶交互,就能大大減小對(duì)用戶感知能力的要求。
4.個(gè)性化交互:與不同人交互時(shí),智能設(shè)備提供的交互方式和內(nèi)容是用戶所感興趣的。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論