0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

盤點AIoT領(lǐng)域中人機交互的市場機會

mK5P_AItists ? 來源:cg ? 2018-12-21 16:01 ? 次閱讀

自2017年開始,“AIoT”一詞便開始頻頻刷屏,成為物聯(lián)網(wǎng)的行業(yè)熱詞?!癆IoT”即“AI+IoT”,指的是人工智能技術(shù)與物聯(lián)網(wǎng)在實際應(yīng)用中的落地融合。當前,已經(jīng)有越來越多的人將AI與IoT結(jié)合到一起來看,AIoT作為各大傳統(tǒng)行業(yè)智能化升級的最佳通道,已經(jīng)成為物聯(lián)網(wǎng)發(fā)展的必然趨勢。

在基于IoT技術(shù)的市場里,與人發(fā)生聯(lián)系的場景(如智能家居、自動駕駛、智慧醫(yī)療、智慧辦公)正在變得越來越多。而只要是與人發(fā)生聯(lián)系的地方,勢必都會涉及人機交互的需求。人機交互是指人與計算機之間使用某種對話語言,以一定的交互方式,為完成確定任務(wù)的人與計算換機之間的信息交互過程。人機交互的范圍很廣,小到電燈開關(guān),大到飛機上的儀表板或是發(fā)電廠的控制室等等。而隨著智能終端設(shè)備的爆發(fā),用戶對于人與機器間的交互方式也提出了全新要求,使得AIoT人機交互市場被逐漸激發(fā)起來。

AIoT發(fā)展路徑

以智能家居市場為例,數(shù)據(jù)顯示,2018年中國智能家居規(guī)模將達到1800億元,到2020年智能家居市場規(guī)模將達到3576億元。分析師預(yù)測,2021年全球智能家居市場規(guī)模將達5000多億元。飛速爆發(fā)中的AIoT市場,所蘊藏的人機交互需求及前景無疑是令人期待的。

人類生活的數(shù)字化進程已持續(xù)約三十年,這些年我們經(jīng)歷了從模擬時代到PC互聯(lián)時代再移動互聯(lián)時代的演進,而目前我們正處在向物聯(lián)網(wǎng)時代的演進過程中。從交互方式上來講,我們可以看到機器是越來越“遷就”人的:從PC時代的鍵盤和鼠標到移動時代的觸屏、NFC以及各種MEMS傳感器,再到物聯(lián)網(wǎng)時代正在蓬勃發(fā)展的語音/圖像等交互方式,使用門檻正在變得越來越低,這導致了越來越多的用戶的卷入。同時我們需要注意到另一個深刻的變化,即由于交互方式的演進(至少是重要原因之一),大量的新維度的數(shù)據(jù)也在不斷地被創(chuàng)造出來和數(shù)字化,比如PC時代的工作資料和娛樂節(jié)目,智能手機時代的用戶使用習慣、位置、信用和貨幣,再到物聯(lián)網(wǎng)時代的各種可能的新數(shù)據(jù)。

在物聯(lián)網(wǎng)時代,交互方式正在往本體交互的方向發(fā)展。所謂“本體交互”,指的是從人的本體出發(fā)的,人與人之間交互的基本方式,如語音、視覺、動作、觸覺,甚至味覺等。例如,通過聲音控制家電,或者空調(diào)通過紅外來決定是否應(yīng)該降溫,通過語音和紅外結(jié)合來進行溫度的控制(偵測到房間里沒人的時候,即便電視節(jié)目里提到了“降溫”,空調(diào)也不做反應(yīng))。

新的數(shù)據(jù)是AI的養(yǎng)料,而大量的新維度的數(shù)據(jù)正在為AIoT創(chuàng)造出無限可能。

從AIoT發(fā)展路徑來看,當前行業(yè)人士普遍認為,其將經(jīng)歷單機智能、互聯(lián)智能到主動智能的三大階段。

單機智能指的是智能設(shè)備等待用戶發(fā)起交互需求,而這個過程中設(shè)備與設(shè)備之間是不發(fā)生相互聯(lián)系的。這種情境下,單機系統(tǒng)需要精確感知、識別、理解用戶的各類指令,如語音、手勢等,并正確決策、執(zhí)行和反饋。AIoT行業(yè)正處于這一階段。以家電行業(yè)為例,過去的家電就是一個功能機時代,就像以前的手機按鍵式的,幫你把溫度降下來,幫你實現(xiàn)食物的冷藏;現(xiàn)在的家電實現(xiàn)了單機智能,就是語音或手機APP的遙控去實現(xiàn)調(diào)溫度、打開風扇等。

無法互聯(lián)互通的智能單品,只是一個個數(shù)據(jù)和服務(wù)的孤島,遠遠滿足不了人們使用需求。要取得智能化場景體驗的不斷升級、優(yōu)化,首先需要打破的是單品智能的孤島效應(yīng)。而互聯(lián)智能場景,本質(zhì)上指的是一個相互互聯(lián)互通的產(chǎn)品矩陣,因而,“一個大腦(云或者中控),多個終端(感知器)”的模式成為必然。例如,當用戶在臥室里對空調(diào)說關(guān)閉客廳的窗簾,而空調(diào)和客廳的智能音箱中控是連接的,他們之間可以互相商量和決策,進而做出由音箱關(guān)閉客廳窗簾的動作;又或者當用戶晚上在臥室對著空調(diào)說出“睡眠模式”時,不僅僅空調(diào)自動調(diào)節(jié)到適宜睡眠的溫度,同時,客廳的電視、音箱,以及窗簾、燈設(shè)備都自動進入關(guān)閉狀態(tài)。這就是一個典型的通過云端大腦,配合多個感知器的互聯(lián)智能的場景落地。

主動智能指的是智能系統(tǒng)根據(jù)用戶行為偏好、用戶畫像、環(huán)境等各類信息,隨時待命,具有自學習、自適應(yīng)、自提高能力,可主動提供適用于用戶的服務(wù),而無需等待用戶提出需求,正如一個私人秘書。試想這樣的場景,清晨伴隨著光線的變化,窗簾自動緩緩開啟,音箱傳來舒緩的起床音樂,新風系統(tǒng)和空調(diào)開始工作。你開始洗漱,洗漱臺前的私人助手自動為你播報今日天氣、穿衣建議等。洗漱完畢,早餐和咖啡已經(jīng)做好。當你走出家門,家里的電器自動斷電,等待你回家時再度開啟。

AIoT的實現(xiàn)對邊緣計算能力提出需求

邊緣計算指在靠近物或數(shù)據(jù)源頭的網(wǎng)絡(luò)邊緣側(cè),融合網(wǎng)絡(luò)、計算、存儲、應(yīng)用核心能力的開放平臺,就近提供邊緣智能服務(wù),滿足行業(yè)數(shù)字化在敏捷連接、實時業(yè)務(wù)、數(shù)據(jù)優(yōu)化、應(yīng)用智能、安全與隱私保護等方面的關(guān)鍵需求。在行業(yè)內(nèi)有個十分形象的比方,邊緣計算猶如人類身體的神經(jīng)末梢,可以對簡單的刺激進行自行處理,并將特征信息反饋給云端大腦。伴隨AIoT的落地實現(xiàn),在萬物智聯(lián)的場景中,設(shè)備與設(shè)備間將互聯(lián)互通,形成數(shù)據(jù)交互、共享的嶄新生態(tài)。在這個過程中,終端不僅需要有更加高效的算力,在大多數(shù)場景中,還必須具有本地自主決斷及響應(yīng)能力。拿智能音箱舉例,其不僅需要支持本地喚醒的能力,還應(yīng)該具備遠講降噪的能力,而由于實時性以及數(shù)據(jù)有效性的考慮,這方面的計算必須發(fā)生在設(shè)備端而不是云端。

智能家居行業(yè)作為AIoT人機交互最重要的落地場景,正吸引越來越多企業(yè)進入。在這其中,既有如Apple、Google、Amazon等這樣的科技巨頭,也有像海爾、三星這類的傳統(tǒng)家電廠商,當然也不乏小米、京東這樣的互聯(lián)網(wǎng)新貴?;诨ヂ?lián)智能的構(gòu)想,未來的AIoT時代,每個設(shè)備都需要具備一定的感知(如預(yù)處理)、推斷以及決策功能。因此,每個設(shè)備端都需要具備一定不依賴于云端的獨立計算能力,即上面提到的邊緣計算。

在智能家居的場景下,通過自然語音的方式與終端設(shè)備進行交互,在當前已成為行業(yè)主流。由于家庭場景的特殊性,家用終端設(shè)備需精準區(qū)分、提取正確的用戶命令(而不是家人在談話時無意說到的無效關(guān)鍵詞),以及聲源、聲紋等信息,因此,智能家居領(lǐng)域的語音交互對于邊緣計算也提出了更高要求,具體表現(xiàn)在以下幾方面:

遠講降噪、喚醒

家居環(huán)境下聲場復(fù)雜,比如電視聲音、多人對話、小孩嬉鬧、空間混響(廚房做飯、洗衣機等設(shè)備工作噪音),這些容易干擾用戶與設(shè)備間正常交互的聲音,很大概率會在同一時間存在,這就需要對各種干擾進行處理、抑制,使得來自真正用戶的聲音更加突出。在這個處理的過程中,設(shè)備需要更多的信息量來進行輔助判斷。家居場景語音交互的一個必備功能是使用麥克風陣列進行多通道的同步聲音錄入,通過對聲學空間場景進行分析,使得聲音的空間定位更加準確,大幅提升語音質(zhì)量。另一個重要功能是通過聲紋信息輔助區(qū)分真正用戶,使他的聲音從多人的竄擾中更加清晰地區(qū)分出來。這些都需要在設(shè)備端實現(xiàn),且需要較大的算力支持。

本地識別

家居領(lǐng)域人機交互的本地識別離不開邊緣計算,具體體現(xiàn)兩個方面:

高頻詞。從實際統(tǒng)計來看,用戶在特定場景下的常用關(guān)鍵詞指令數(shù)量有限。例如車機產(chǎn)品,用戶最常使用的可能是“上一首/下一首”,空調(diào)產(chǎn)品有可能最常用的命令是“開啟/關(guān)閉”等,這些用戶經(jīng)常用到的詞就叫做高頻詞。對于高頻詞的處理,完全可以放在本地處理而不依賴于云端的延時,從而帶給用戶最佳的體驗。

聯(lián)網(wǎng)率。在智能家居產(chǎn)品尤其是家電產(chǎn)品落地的過程中,聯(lián)網(wǎng)率是一個問題。如何在不聯(lián)網(wǎng)的情況下讓用戶感知到語音AI的強大,進行用戶培養(yǎng),也是邊緣計算在當前的一個重要作用。

本地/云端效率的平衡

家居領(lǐng)域的自然語言交互過程中,當所有的計算被放到云端時,聲學計算的部分將對云端計算造成較大壓力,一方面造成云平臺成本的大幅增加;另一方面帶來計算延遲,損害用戶體驗。自然語音交互分成聲學和自然語言理解(NLP)兩個部分,從另一個維度上來講,可看成是“業(yè)務(wù)無關(guān)”(語音轉(zhuǎn)文字/聲學計算)和“業(yè)務(wù)有關(guān)”(NLP)的部分。業(yè)務(wù)有關(guān)的部分毫無疑問需要在云端解決,例如用戶問天氣、聽音樂等需求,那么設(shè)備對用戶語句的理解,以及天氣信息的獲取必須通過聯(lián)網(wǎng)來完成。但是,對于用戶語音到文字的轉(zhuǎn)換,例如下達指令“打開空調(diào)、增加溫度等”,其中的部分甚至大部分計算是有可能在本地完成的。這種情況下,從本地上傳到云端的數(shù)據(jù)將不再是壓縮后的語音本身,而是更為精簡的中間結(jié)果甚至是文本本身,數(shù)據(jù)更為精簡,云端計算更為簡單,則響應(yīng)也更為迅速。

多模態(tài)的需求

所謂多模態(tài)交互即多種本體交互手段結(jié)合后的交互,例如將多種感官融合,比如文字、語音、視覺、動作、環(huán)境等。人是一個典型的多模態(tài)交互的例子,在人與人交流的過程中,表情、手勢、擁抱、觸摸,甚至是氣味,無不在信息交換的過程中起著不可替代的作用。顯然,智能家居的人機交互勢必不止語音一個模態(tài),而是需要多模態(tài)交互并行。舉個例子,智能音箱如果看到人不在家,那就完全不需要對電視里誤放出的喚醒詞進行響應(yīng),甚至可以把自己調(diào)到睡眠狀態(tài);一個機器人如果感覺到主人在注視他,那么可能會主動向主人打招呼并詢問是否需要提供幫助。多模態(tài)處理無疑需要引入對多類傳感器數(shù)據(jù)的共同分析和計算,這些數(shù)據(jù)既包括一維的語音數(shù)據(jù),也會包括攝像頭圖像以及熱感應(yīng)圖像等二維數(shù)據(jù)。這些數(shù)據(jù)的處理無不需要本地AI的能力,也就對邊緣計算提出了強力的需求。

AIoT帶來的AI芯片需求

AI算法對設(shè)備端芯片的并行計算能力和存儲器帶寬提出了更高的要求,盡管基于GPU的傳統(tǒng)芯片能夠在終端實現(xiàn)推理算法,但其功耗大、性價比低的弊端卻不容忽視。在AIoT的大背景下,IoT設(shè)備被賦予了AI能力,一方面在保證低功耗、低成本的同時完成AI運算(邊緣計算);另一方面,IoT設(shè)備與手機不同,形態(tài)千變?nèi)f化,需求碎片化嚴重,對AI算力的需求也不盡相同,很難給出跨設(shè)備形態(tài)的通用芯片架構(gòu)。因此,只有從IoT的場景出發(fā),設(shè)計定制化的芯片架構(gòu),才能在大幅提升性能的同時,降低功耗和成本,同時滿足AI算力以及跨設(shè)備形態(tài)的需求。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28876

    瀏覽量

    266218
  • IOT
    IOT
    +關(guān)注

    關(guān)注

    186

    文章

    4097

    瀏覽量

    195085

原文標題:深度解析AIoT背后的發(fā)展邏輯

文章出處:【微信號:AItists,微信公眾號:人工智能學家】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    聚徽-工控一體機是如何實現(xiàn)人機交互

    工控一體機實現(xiàn)人機交互的方式是多種多樣的,結(jié)合搜索結(jié)果,我們可以歸納出以下幾種主要的實現(xiàn)方式:
    的頭像 發(fā)表于 09-10 09:31 ?151次閱讀

    基于傳感器的人機交互技術(shù)

    基于傳感器的人機交互技術(shù)是現(xiàn)代科技發(fā)展的重要領(lǐng)域之一,它極大地推動了人機交互的便捷性、自然性和智能性。本文將詳細探討基于傳感器的人機交互技術(shù),包括其基本原理、關(guān)鍵技術(shù)、應(yīng)用
    的頭像 發(fā)表于 07-17 16:52 ?420次閱讀

    人機界面交互方式的介紹

    人機界面(Human-Computer Interaction, HCI)是研究人與計算機之間交互方式的學科。隨著計算機技術(shù)的發(fā)展,人機交互方式也在不斷地演變和創(chuàng)新。以下是對各種人機交互
    的頭像 發(fā)表于 07-01 14:22 ?411次閱讀

    人機交互界面是什么_人機交互界面的功能

    人機交互界面(Human-Computer Interaction Interface,簡稱HCI或HMI),也被稱為人機界面(MMI)、操作員界面終端(OIT)、本地操作員界面(LOI)或操作員
    的頭像 發(fā)表于 06-22 11:03 ?1217次閱讀

    工業(yè)平板電腦在人機交互中的應(yīng)用

    工業(yè)平板電腦在人機交互(Human-Machine Interaction,HMI)中扮演著至關(guān)重要的角色,它們通過直觀的界面和強大的計算能力,極大地提升了工業(yè)環(huán)境下的操作效率和用戶體驗。以下是工業(yè)平板電腦在人機交互中的具體應(yīng)用:
    的頭像 發(fā)表于 06-18 12:00 ?175次閱讀

    人機交互與人機界面的區(qū)別與聯(lián)系

    隨著信息技術(shù)的飛速發(fā)展,人機交互(Human-Computer Interaction,HCI)已成為現(xiàn)代社會不可或缺的一部分。人機交互技術(shù),作為實現(xiàn)人與計算機之間有效通信的橋梁,不僅改變了我們
    的頭像 發(fā)表于 06-07 15:29 ?537次閱讀

    芯??萍肌皦喝荻弦籗oC”系列芯片打造極致人機交互體驗

    5月7日晚,蘋果春季新品發(fā)布特別活動推出全新升級的Apple Pencil Pro,持續(xù)深度布局壓力觸控人機交互領(lǐng)域。
    的頭像 發(fā)表于 05-11 10:00 ?340次閱讀
    芯??萍肌皦喝荻弦籗oC”系列芯片打造極致<b class='flag-5'>人機交互</b>體驗

    人機交互的三個階段 人機交互的常用方式

    交互經(jīng)歷的三個階段:命令行界面交互階段、圖形用戶界面交互階段、自然和諧的人機交互階段。
    的頭像 發(fā)表于 03-13 17:25 ?2140次閱讀

    人機交互系統(tǒng)的發(fā)展史及過程步驟

    人機交互系統(tǒng)還包括用戶界面(UI),它是用戶與系統(tǒng)之間進行信息交流和控制活動的載體。用戶界面可以是軟件系統(tǒng)界面,通過顯示器呈現(xiàn)系統(tǒng)信息,并接收來自用戶的視覺、聽覺等感官的輸入。
    的頭像 發(fā)表于 03-11 17:15 ?1774次閱讀
    <b class='flag-5'>人機交互</b>系統(tǒng)的發(fā)展史及過程步驟

    人機交互技術(shù)有哪幾種 人機交互技術(shù)的發(fā)展趨勢

    人機交互技術(shù)是指人與計算機之間通過各種交互方式進行信息傳遞、操作和控制的技術(shù)。隨著科技的進步,人機交互技術(shù)也在不斷發(fā)展創(chuàng)新。以下將介紹人機交互技術(shù)的幾種常見形式以及當前的發(fā)展趨勢。 一
    的頭像 發(fā)表于 01-22 17:47 ?2723次閱讀

    情感語音識別技術(shù)在人機交互中的應(yīng)用與展望

    一、引言 隨著人工智能技術(shù)的不斷發(fā)展,人機交互已經(jīng)滲透到日常生活的方方面面。情感語音識別作為人機交互中的關(guān)鍵技術(shù)之一,能夠通過分析人類語音中的情感信息實現(xiàn)更加智能化和個性化的人機交互。本文將探討
    的頭像 發(fā)表于 11-22 10:40 ?628次閱讀

    把ChatGPT塞進副駕駛!清華、中科院、MIT聯(lián)合提出Co-Pilot人機交互框架

    作為本年度人工智能領(lǐng)域最重要的突破之一,大語言模型相關(guān)研究始終是各大相關(guān)領(lǐng)域的關(guān)注焦點。 近日,來自清華大學、中國科學院、MIT的科研人員對于大語言模型在人機交互領(lǐng)域中的應(yīng)用進行了研究
    的頭像 發(fā)表于 11-20 09:10 ?522次閱讀
    把ChatGPT塞進副駕駛!清華、中科院、MIT聯(lián)合提出Co-Pilot<b class='flag-5'>人機交互</b>框架

    情感語音識別在人機交互中的應(yīng)用與挑戰(zhàn)

    一、引言 情感語音識別是近年來人工智能領(lǐng)域的研究熱點之一,它能夠通過分析人類語音中的情感信息實現(xiàn)更加智能化和個性化的人機交互。本文將探討情感語音識別在人機交互中的應(yīng)用、面臨的挑戰(zhàn)以及未來的發(fā)展趨勢
    的頭像 發(fā)表于 11-15 15:42 ?449次閱讀

    物理人機交互控制性能量化指標有哪些

    在物理人機交互控制中,常用的性能量化指標包括: 1. 動作準確性(Action Accuracy):衡量人機交互中實際動作與期望動作之間的誤差。準確性高表示實際動作與期望動作的一致性好,控制系統(tǒng)能夠
    的頭像 發(fā)表于 11-09 16:19 ?884次閱讀

    情感語音識別技術(shù)在人機交互中的應(yīng)用與挑戰(zhàn)

    ?一、引言 隨著人工智能技術(shù)的不斷發(fā)展,人機交互已經(jīng)成為了研究的熱點之一。情感語音識別技術(shù)作為人機交互中的重要組成部分,能夠通過識別人的語音情感,實現(xiàn)更加智能化和個性化的交互體驗。本文將探討情感語音
    的頭像 發(fā)表于 11-09 15:27 ?667次閱讀