0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

智能語(yǔ)音交互是怎么實(shí)現(xiàn)交互流程中的輸入輸出呢?

鼎酷IOT部落 ? 來(lái)源:未知 ? 作者:李倩 ? 2018-03-13 15:49 ? 次閱讀

小愛(ài)同學(xué)是小米公司于2017年7月26日發(fā)布的收款人工智能AI)音箱的喚醒詞及二次元人物形象。小愛(ài)同學(xué)一經(jīng)推入市場(chǎng)便受萬(wàn)千寵愛(ài),網(wǎng)絡(luò)上關(guān)于小愛(ài)同學(xué)的使用體驗(yàn)各式各樣,無(wú)不是在稱(chēng)贊,他們對(duì)小愛(ài)同學(xué)的功能、特點(diǎn)無(wú)不熟悉,但是你知道小愛(ài)同學(xué)是怎么工作的嗎?

智能語(yǔ)音交互是人工智能的分支,相當(dāng)于語(yǔ)音助手,屬于一款智能型的手機(jī)應(yīng)用,通過(guò)智能對(duì)話(huà)與即時(shí)問(wèn)答的智能交互,實(shí)現(xiàn)幫助用戶(hù)解決問(wèn)題的功能。

說(shuō)起智能語(yǔ)音助手大家首先想起的是哪些呢?

1. Siri

蘋(píng)果iOS系統(tǒng)中的人工智能助手軟件

2. Cortana

微軟開(kāi)發(fā)的全球第一款人工智能助手,中文名小娜,橫跨手機(jī)與PC兩大平臺(tái)。

3. Alexa

亞馬遜推出的語(yǔ)音助手,主要搭載在Amazon Fcho智能音箱上。

智能語(yǔ)音交互是怎么實(shí)現(xiàn)交互流程中的輸入輸出呢?

智能語(yǔ)音交互界面事實(shí)上包含了三個(gè)技術(shù)環(huán)節(jié):

1. 語(yǔ)音識(shí)別(ASR)

將人類(lèi)的語(yǔ)音中的詞匯轉(zhuǎn)換為計(jì)算機(jī)可讀的輸入,一般包括了信號(hào)處理,盡可能的降低環(huán)境噪聲、信道、說(shuō)話(huà)人等因素對(duì)特征造成的影響。用戶(hù)根據(jù)系統(tǒng)設(shè)計(jì)的口令密碼與系統(tǒng)進(jìn)行溝通。

比如:小愛(ài)同學(xué)的操作執(zhí)行,每次發(fā)出指令的模式必須是“小愛(ài)同學(xué)+工作任務(wù)”,小愛(ài)同學(xué)接收后在把語(yǔ)音轉(zhuǎn)化成文字,再結(jié)合文字做出指令回復(fù)。

2. 語(yǔ)義處理(NLP)

自然語(yǔ)言的處理,就是把人的語(yǔ)言轉(zhuǎn)化成機(jī)器能夠理解的數(shù)字,分解開(kāi),并回復(fù)相應(yīng)的語(yǔ)言。很多在購(gòu)買(mǎi)智能音箱之后都會(huì)有覺(jué)得是“智障音箱”的主要原因就在這里,現(xiàn)在的技術(shù)條件下,只能做到固定的回答,無(wú)法像人類(lèi)一樣思考,再加上人類(lèi)語(yǔ)言有大量的表達(dá)方式和歧義語(yǔ)句,理解錯(cuò)誤的地方也非常多。語(yǔ)義處理的主要目的就是把人類(lèi)語(yǔ)言與機(jī)器語(yǔ)言盡可能的相互接近,實(shí)現(xiàn)真正的用戶(hù)正常對(duì)話(huà)。

3. 語(yǔ)音合成(TTS)

是通過(guò)機(jī)械的、電子的方法產(chǎn)生人造語(yǔ)音的技術(shù),將計(jì)算機(jī)自己產(chǎn)生的、或外部輸入的文字信息轉(zhuǎn)變?yōu)闃?lè)意聽(tīng)得懂的、流利的漢語(yǔ)口語(yǔ)輸出的技術(shù),可以讓機(jī)器人像人一樣開(kāi)口說(shuō)話(huà),小愛(ài)同學(xué)就是通過(guò)這項(xiàng)技術(shù)跟你交流的。

語(yǔ)音交互發(fā)展的優(yōu)勢(shì)

1. 解放雙手、雙眼、雙腿,接觸空間限制,遠(yuǎn)場(chǎng)可交互

2. 指向明確,語(yǔ)義直達(dá)目標(biāo),縮短使用路徑

3. 自然簡(jiǎn)單人性化,學(xué)習(xí)門(mén)檻低

4. 可以一對(duì)一,也可以一對(duì)多

5. 對(duì)硬件的要求低

語(yǔ)音交互的劣勢(shì)

1. 不適合用戶(hù)選擇多、流程長(zhǎng),需要大量輔助信息決策的交互任務(wù)

2. 遠(yuǎn)場(chǎng)語(yǔ)音交互對(duì)距離、噪音、混響、聲源數(shù)量等有一定的要求

3. 不適用于公共場(chǎng)合,需要安靜的嘗試

4. 依賴(lài)嘴巴和耳朵,對(duì)語(yǔ)種、口音和發(fā)音有一定要求

5. 輸出信息單一,表達(dá)能力有限

從技術(shù)和時(shí)間上來(lái)說(shuō),現(xiàn)在的智能語(yǔ)音交互系統(tǒng)還是存在一定缺陷和局限的,但是我們相信任何技術(shù)都是在實(shí)踐中成長(zhǎng)的,你們的小愛(ài)同學(xué)也會(huì)越來(lái)越惹人愛(ài)的。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29806

    瀏覽量

    268106
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46652

    瀏覽量

    237083
  • 智能語(yǔ)音
    +關(guān)注

    關(guān)注

    10

    文章

    774

    瀏覽量

    48684

原文標(biāo)題:智能語(yǔ)音交互:你知道小愛(ài)同學(xué)是怎么工作的嗎?

文章出處:【微信號(hào):dkiot888,微信公眾號(hào):鼎酷IOT部落】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    【實(shí)操文檔】在智能硬件的大模型語(yǔ)音交互流程接入RAG知識(shí)庫(kù)

    本帖最后由 jf_40317719 于 2024-9-29 17:13 編輯 智能硬件的語(yǔ)音交互接入大模型后可以直接理解自然語(yǔ)言?xún)?nèi)容,但大模型作為一個(gè)語(yǔ)言模型,對(duì)專(zhuān)業(yè)領(lǐng)域知識(shí)的訓(xùn)練缺乏也是
    發(fā)表于 09-29 17:12

    車(chē)載導(dǎo)航人機(jī)語(yǔ)音交互系統(tǒng)的實(shí)現(xiàn)

    利用小詞匯量的關(guān)鍵詞識(shí)別引擎實(shí)現(xiàn)大詞匯量POI名稱(chēng)的識(shí)別,并且獲得了滿(mǎn)意的識(shí)別正確率,但是耗時(shí)較長(zhǎng)。結(jié)語(yǔ)本文主要完成了車(chē)載導(dǎo)航人機(jī)語(yǔ)音交互系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn),并在實(shí)驗(yàn)室環(huán)境
    發(fā)表于 08-15 21:27

    【Gokit 3試用體驗(yàn)】通過(guò)Lark 7618模組實(shí)現(xiàn)語(yǔ)音交互+語(yǔ)音交互UI設(shè)計(jì)理念

    語(yǔ)言是人類(lèi)交互最自然最舒適的方法,而今天,機(jī)智云Gokit 3上Lark7618智能語(yǔ)音識(shí)別模塊提供了一個(gè)很好的外圍音頻實(shí)時(shí)采集電路,以及快速的音頻合成輸出系統(tǒng),有這兩樣,加持Goki
    發(fā)表于 08-28 13:46

    智能音箱混戰(zhàn) 遠(yuǎn)場(chǎng)語(yǔ)音交互只是開(kāi)始

      導(dǎo)讀:遠(yuǎn)場(chǎng)語(yǔ)音交互開(kāi)始是智能音響,但是將來(lái)絕對(duì)不僅僅是智能音響,技術(shù)還會(huì)擴(kuò)展到很多其他的產(chǎn)品。   7月5日,阿里推出了自己的首款消費(fèi)級(jí)AI產(chǎn)品天貓精靈X1,同日百度也宣布了Du
    發(fā)表于 07-17 09:37

    請(qǐng)問(wèn)labview動(dòng)態(tài)調(diào)用子vi的輸入輸出怎么和主程序交互

    labview動(dòng)態(tài)調(diào)用子vi,子vi的輸入輸出怎么和主程序交互
    發(fā)表于 01-16 20:17

    車(chē)載導(dǎo)航人機(jī)語(yǔ)音交互系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)

    的設(shè)計(jì),根據(jù)人機(jī)交互的需求,設(shè)計(jì)語(yǔ)音導(dǎo)航系統(tǒng)的硬件框架如圖 1所示。語(yǔ)音導(dǎo)航系統(tǒng)和用戶(hù)之間的人機(jī)交互接口由觸摸屏、按鈕、話(huà)筒、顯示屏和擴(kuò)音
    發(fā)表于 05-07 07:00

    樹(shù)莓派語(yǔ)音交互如何實(shí)現(xiàn)開(kāi)關(guān)燈?

    樹(shù)莓派語(yǔ)音交互如何實(shí)現(xiàn)開(kāi)關(guān)燈?
    發(fā)表于 11-08 07:08

    探析智能語(yǔ)音交互應(yīng)用和技術(shù)

    北京聲加科技CEO邱鋒海受邀以《聲加萬(wàn)物、聆聽(tīng)未來(lái):智能語(yǔ)音交互應(yīng)用和技術(shù)》為題,分享了目前正在爆發(fā)的智能語(yǔ)音
    的頭像 發(fā)表于 11-23 09:54 ?4781次閱讀

    什么是人機(jī)交互技術(shù)?

    計(jì)算機(jī)輸入、輸出設(shè)備,以有效的方式實(shí)現(xiàn)人與計(jì)算機(jī)對(duì)話(huà)的技術(shù)。 人機(jī)交互系統(tǒng)的主要組成 1、多模態(tài)輸入/
    的頭像 發(fā)表于 11-02 15:14 ?1.9w次閱讀

    智能交互終端的功能 智能交互終端怎么設(shè)置

    智能交互終端是指能夠通過(guò)人機(jī)交互的方式,實(shí)現(xiàn)信息互動(dòng)、控制操作等功能的設(shè)備。具體包括以下幾個(gè)方面的功能:   1. 語(yǔ)音
    的頭像 發(fā)表于 04-16 11:53 ?4184次閱讀

    什么是智能交互終端功能

    家一起來(lái)看一下吧。 智能交互系統(tǒng) 智能交互系統(tǒng)是指通過(guò)計(jì)算機(jī)輸入、輸出設(shè)備,以有效的方式
    發(fā)表于 06-15 14:04 ?732次閱讀

    智能座艙的語(yǔ)音交互系統(tǒng)技術(shù)應(yīng)用

    從用戶(hù)發(fā)出語(yǔ)音指令到實(shí)現(xiàn)智能設(shè)備的交互,其過(guò)程并不像其名詞描述的那么簡(jiǎn)單,要實(shí)現(xiàn)通過(guò)語(yǔ)音來(lái)完成
    發(fā)表于 07-28 10:17 ?535次閱讀
    <b class='flag-5'>智能</b>座艙的<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>系統(tǒng)技術(shù)應(yīng)用

    請(qǐng)問(wèn)MCU是如何實(shí)現(xiàn)IO口的輸入輸出控制的?

    GPIO(General Port Input&Output)通用輸入輸出接口,MCU各個(gè)管腳對(duì)外交互最根本的單位。
    發(fā)表于 08-10 11:10 ?2917次閱讀
    請(qǐng)問(wèn)MCU是如何<b class='flag-5'>實(shí)現(xiàn)</b>IO口的<b class='flag-5'>輸入輸出</b>控制的?

    情感語(yǔ)音識(shí)別技術(shù)在人機(jī)交互的應(yīng)用與挑戰(zhàn)

    ?一、引言 隨著人工智能技術(shù)的不斷發(fā)展,人機(jī)交互已經(jīng)成為了研究的熱點(diǎn)之一。情感語(yǔ)音識(shí)別技術(shù)作為人機(jī)交互的重要組成部分,能夠通過(guò)識(shí)別人的
    的頭像 發(fā)表于 11-09 15:27 ?776次閱讀

    智能語(yǔ)音交互技術(shù)如何助力設(shè)備實(shí)現(xiàn)人機(jī)自然對(duì)話(huà)

    智能語(yǔ)音交互技術(shù)是指通過(guò)語(yǔ)音識(shí)別、語(yǔ)音合成和自然語(yǔ)言理解等技術(shù),實(shí)現(xiàn)人與機(jī)器之間自然語(yǔ)言的交流和
    的頭像 發(fā)表于 05-23 15:14 ?346次閱讀