在2019年,三星就曾預(yù)告過(guò)新的“人造人”NEON助手,并表示NEON可以像真正的人類一樣進(jìn)行對(duì)話,并有一定的感知能力。NEON的網(wǎng)站上宣傳其外觀和行為都像真實(shí)的人類,能夠表現(xiàn)出情感和智慧,而據(jù)相關(guān)消息,三星最終將隨三星Galaxy S21 Ultra獨(dú)家發(fā)售這款數(shù)字助手。
數(shù)字助手首先也是一款手機(jī)助手軟件,目前,智能手機(jī)能夠提供各種類型的應(yīng)用服務(wù),其中就包括手機(jī)助手軟件,用戶可以通過(guò)語(yǔ)音、文字等方式與智能手機(jī)之間進(jìn)行交互,智能手機(jī)通過(guò)該語(yǔ)音識(shí)別助手軟件識(shí)別語(yǔ)音后,提供對(duì)應(yīng)的應(yīng)用服務(wù)。
智能手機(jī)識(shí)別語(yǔ)音的功能可以有三種方式:交互任務(wù)型、知識(shí)問(wèn)答型及閑聊型。其中,交互任務(wù)型語(yǔ)音識(shí)別方式使得用戶可以通過(guò)直接的語(yǔ)音輸入,由智能手機(jī)識(shí)別該語(yǔ)音,完成與智能手機(jī)的應(yīng)用服務(wù)之間的交互意圖,而無(wú)需進(jìn)行多次語(yǔ)音識(shí)別界面的操作。
但是,智能手機(jī)提供的交互任務(wù)型語(yǔ)音識(shí)別方式對(duì)用戶來(lái)說(shuō),使用率并不高,這是因?yàn)橛脩粼谕ㄟ^(guò)語(yǔ)音操控智能手機(jī)時(shí),存在以下缺點(diǎn):1)公眾場(chǎng)合不適合使用語(yǔ)音,有隱私問(wèn)題;2) 智能手機(jī)處于嘈雜的遠(yuǎn)程環(huán)境下,語(yǔ)音識(shí)別的效果不佳;3)因?yàn)橛脩舭l(fā)音不準(zhǔn)確,形同意思的表述方式多樣等因素,語(yǔ)音識(shí)別和語(yǔ)音理解的準(zhǔn)確率還需要提高;4)有些用戶不習(xí)慣使用智能手機(jī)提供的語(yǔ)音識(shí)別界面。
那么,智能手機(jī)該如何在這些條件下簡(jiǎn)便且準(zhǔn)確地采用語(yǔ)音識(shí)別方式實(shí)現(xiàn)交互任務(wù)呢?為此,三星在2019年9月27日申請(qǐng)了一項(xiàng)名為“一種采用語(yǔ)音識(shí)別方式實(shí)現(xiàn)交互任務(wù)的方法及系統(tǒng)”的發(fā)明專利(申請(qǐng)?zhí)枺?01910921533.6),申請(qǐng)人為三星電子(中國(guó))研發(fā)中心和三星電子株式會(huì)社。
根據(jù)該專利目前公開(kāi)的資料,讓我們一起來(lái)看看這項(xiàng)應(yīng)用于智能設(shè)備的語(yǔ)音識(shí)別方法及系統(tǒng)吧。
如上圖,為該專利中發(fā)明的采用語(yǔ)音識(shí)別方式實(shí)現(xiàn)交互任務(wù)的方法流程示意圖,首先,系統(tǒng)會(huì)基于當(dāng)前環(huán)境進(jìn)行語(yǔ)音識(shí)別來(lái)得到文本以及語(yǔ)義信息,基于得到的文本以及語(yǔ)義信息,來(lái)確定對(duì)應(yīng)的上下文信息,且劃分不同的場(chǎng)景,基于不同的場(chǎng)景來(lái)在系統(tǒng)中匹配不同的語(yǔ)音技能推薦表。
這種利用語(yǔ)音技能推薦表的方式,可以更加準(zhǔn)確的應(yīng)對(duì)不同的場(chǎng)景,通過(guò)事先準(zhǔn)備好豐富的語(yǔ)料庫(kù),就可以非常人性化的與用戶進(jìn)行對(duì)話以及完成相應(yīng)的操作。而當(dāng)要實(shí)現(xiàn)交互任務(wù)時(shí),則會(huì)根據(jù)語(yǔ)音技能推薦表執(zhí)行智能手機(jī)的交互任務(wù)。同時(shí),由于是智能助手主動(dòng)分析用戶所處場(chǎng)景,并主動(dòng)提供相關(guān)的操作服務(wù),因此無(wú)需用戶主動(dòng)發(fā)起語(yǔ)音喚醒,而是由語(yǔ)音助手主動(dòng)為用戶提供相關(guān)服務(wù),只需用戶進(jìn)行選擇即可。
如上圖,為這種采用語(yǔ)音識(shí)別方式實(shí)現(xiàn)交互任務(wù)的方法子流程圖,當(dāng)用戶喚醒語(yǔ)音助手插件模塊時(shí),語(yǔ)音助手插件模塊被觸發(fā),該模塊通知語(yǔ)言輸入信息采集模塊啟動(dòng)信息采集,信息采集模塊通過(guò)上下文感知模塊獲取到當(dāng)前的環(huán)境信息,再向語(yǔ)音助手插件模塊發(fā)送請(qǐng)求,來(lái)獲取從用戶語(yǔ)音識(shí)別得到的文本,以及做自然語(yǔ)言理解后的語(yǔ)義信息。
之后,語(yǔ)言輸入信息采集模塊將采集到的文本、語(yǔ)義信息及當(dāng)前的環(huán)境信息傳輸給語(yǔ)言技能生成模塊,由此來(lái)生成語(yǔ)言技能庫(kù),并通知語(yǔ)言技能推薦模塊。
語(yǔ)言技能推薦模塊在特定情況下可以啟動(dòng),將大量不同的上下文劃分到若干類場(chǎng)景中,對(duì)每個(gè)場(chǎng)景生成相應(yīng)的語(yǔ)言技能推薦表。
如上圖,為在手機(jī)上使用語(yǔ)言技能推薦表的展示圖,該款語(yǔ)音助手插件模塊為Bixby,當(dāng)每次都調(diào)用Bixby時(shí),都會(huì)顯示出語(yǔ)言技能推薦表,并且場(chǎng)景不同,該語(yǔ)言技能推薦表中的推薦技能偶讀不同。
例如,經(jīng)過(guò)學(xué)習(xí)后,如果用戶打開(kāi)手機(jī)并且喚醒了Bixby,則就可以觸發(fā)語(yǔ)言技能推薦表的展示,當(dāng)用戶選擇某條推薦的語(yǔ)言技能時(shí),將該語(yǔ)言技能推薦表中的文本用作用戶語(yǔ)言輸入識(shí)別的結(jié)果,以完成后續(xù)用戶的指令。
以上就是三星發(fā)明的可以完成精準(zhǔn)語(yǔ)音識(shí)別任務(wù)的靜默式語(yǔ)音識(shí)別助手,其在實(shí)現(xiàn)交互任務(wù)時(shí),基于當(dāng)前環(huán)境下對(duì)語(yǔ)音識(shí)別得到文本以及語(yǔ)音信息,在交互時(shí)無(wú)需發(fā)出語(yǔ)音,僅通過(guò)用戶少量選擇操作就可以完成復(fù)雜的交互任務(wù),因此可以簡(jiǎn)便且準(zhǔn)確地采用語(yǔ)音識(shí)別方式來(lái)實(shí)現(xiàn)交互任務(wù)。
責(zé)任編輯:YYX
-
智能手機(jī)
+關(guān)注
關(guān)注
66文章
18419瀏覽量
179730 -
三星電子
+關(guān)注
關(guān)注
34文章
15852瀏覽量
180870 -
語(yǔ)音識(shí)別
+關(guān)注
關(guān)注
38文章
1713瀏覽量
112503
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論