3月10日,由智東西、AWE、極果等聯(lián)合舉辦“GTIC 2017全球(智慧)科技峰會”在上海證大喜馬拉雅中心正式開幕。地平線機(jī)器人副總裁張永謙發(fā)表了名為“‘端+云’點(diǎn)亮智能家居新時代”的主題演講,詳細(xì)解構(gòu)了智能家居在發(fā)展過程中的遇到的四大難點(diǎn)及解法:應(yīng)用場景多而分散、用戶體驗(yàn)復(fù)雜、技術(shù)需要發(fā)展、個性化大數(shù)據(jù)收集。
以下為張永謙演講的要點(diǎn)精摘:
1、目前中國的4億家庭中,有1億為中產(chǎn)階級家庭,智能家居市場非常龐大,智能電子設(shè)備能夠達(dá)到每年萬億市場,其它消費(fèi)及服務(wù)則高達(dá)每年50萬億。
2、未來,家庭人工智能的進(jìn)步趨勢:物理入口分散化到智能設(shè)備、智能家電、智能硬件上;交互方式升級到圖像、語音、觸控;以及決策過程從人類自主決策升級到AI主動推薦。
3、智能家居市場未能爆發(fā)的原因:
1)應(yīng)用場景多而分散:娛樂、健康、教育、家電、玩具、攝像頭等;
2)用戶體驗(yàn)復(fù)雜:真實(shí)場景下的自然交互非常困難;
3)感知、認(rèn)知、傳感器融合技術(shù)等發(fā)展存在難點(diǎn);
4)個性化大數(shù)據(jù)收集需要優(yōu)化。
4、面對應(yīng)用場景多而分散的問題,要找到主要矛盾與不變量,即主體是“人”?;谌四?、動作、人體、語音、以及各種圍繞人的家庭應(yīng)用,深入解決“人”的問題。
5、在技術(shù)上要完成對智能家居最好體驗(yàn)的布局,必須把圖象和語音的技術(shù)融合,只是單獨(dú)的做語音和圖象是缺位的。人的交互和獲取信息采用融合的方式,單獨(dú)的語音和圖象,或者單獨(dú)的其他任何傳感器,都不能涵蓋所有的應(yīng)用場景。一定是“圖象+語音”。另外,視覺價值是高維的,80%的價值信息來自于圖象,只有20%來自于語音。
6、將來的智能家居市場是端+云的架構(gòu)。端智能的價值在于:不依賴于網(wǎng)絡(luò),穩(wěn)定可靠;具備實(shí)時性;可過濾有價值數(shù)據(jù)。云智能的價值方便收集數(shù)據(jù),持續(xù)優(yōu)化用戶體驗(yàn);每一個智能硬件都可支持智能APP;具備移動性,升級本地智能硬件,不受空間限制。
7、智能家居自然的用戶體驗(yàn)解法——語音+圖像的融合,除了依賴麥克風(fēng)的被動交互,還要使用攝像頭進(jìn)行主動交互,更懂用戶,更好的體驗(yàn)。
以下為張永謙在“GTIC 2017全球(智慧)科技峰會”上的演講全文:
張永謙:謝謝大家,我來自地平線,地平線是由百度前IDL院長于凱博士創(chuàng)建的一家嵌入式人工智能的公司,今天很高興有這個機(jī)會給大家介紹一下我們對智能生活整個行業(yè)趨勢的一些思考以及我們在中間做的一些事情。
在講之前,先謝謝陳震剛才對我們的鼓勵。首先談到這個智能生活,其實(shí)在中國,大家看到我們有1億的中產(chǎn)階級家庭,這個市場非常大,這一億家庭他們的年平均收入在30萬到70萬人民幣左右,當(dāng)然說到這個智能家居的市場,大家腦海中的第一個印象是電子設(shè)備,其實(shí)這個市場雖然很大,有一萬億,但是我們認(rèn)為,他只是一個智能家居市場的非常小的一部分,真正的智能家居市場的潛力還是在于其他的家庭消費(fèi)和服務(wù),這個每年的市場是50萬億,現(xiàn)在這個市場是10%通過線上的方式進(jìn)行,當(dāng)我們談智能家居的時候,如果哪個公司或者企業(yè)能夠更方便、更快捷和更精準(zhǔn)的幫助我們的消費(fèi)者進(jìn)行他在家里的消費(fèi)以及獲取想要的這個服務(wù),這個市場是最巨大的。
這個市場這么大,我們看一下對這個市場發(fā)展趨勢的一些思考,我們覺得有三個比較明顯的變化,是已經(jīng)發(fā)生或者會在未來的很快的時間內(nèi)發(fā)生的。第一個是物理入口,現(xiàn)在大家很多時候在家里面都是通過手機(jī)和PC上網(wǎng),大家會發(fā)現(xiàn),手機(jī)和屏幕是一個非常小的屏幕,也非常擁擠,千軍萬馬擠獨(dú)木橋,將來會有一個非常明顯的趨勢,就是整個消費(fèi)和服務(wù)的接入是會分散到各個智能設(shè)備的,將來在家里,每一個硬件都是一個獨(dú)立的APP,你發(fā)現(xiàn)冰箱里面沒有飲料的時候,你不需要打開手機(jī)購買,你可以直接一句話告訴形象,下午給我送一打啤酒過來,將來家里的每一個智能硬件都會是一個服務(wù)的入口,這個是真正的給我們智能硬件帶來的巨大機(jī)會。
第二個是交互方式,最傳統(tǒng)的是通過鍵盤和觸摸屏這樣的方式,隨著語音技術(shù)的進(jìn)步,這個會很快的普及到我們的生活當(dāng)中,我們覺得,在不遠(yuǎn)的將來一定會有一個更為重要、更為重量級的方式,就是通過視覺的交互,因?yàn)檫@個里面也是和人在家里的消費(fèi)以及需要獲取服務(wù)的決策過程密切相關(guān)的。
因?yàn)楝F(xiàn)在大家可以看到,不管是通過觸控還是通過語音進(jìn)行交互,其實(shí)他都是一個人的主動決策的過程,語音呢是作為最方便的一個交互方式,他有非常大的發(fā)展前景,但是他仍然是被動的。語音這個系統(tǒng)本身并不知道你要做什么,直到你告訴他。但是圖象這個方式,這是一個新的交互方式,是一個主動的交互方式。也就是說,在很多的場景之下,比如說舉個例子,我們可以想象一下,將來家里面在陽臺上放一個大的籃子,里面是臟衣服,現(xiàn)在我們有上門洗衣的服務(wù)了,這個籃子里面的衣服累計(jì)到一定程度的時候,這個陽臺有一個攝象頭,自動的聯(lián)系上門的洗衣服務(wù),你根本不用操心,所有的是通過 主動的方式完成的。
將來的消費(fèi)以及服務(wù)會更多的是通過AI主動推薦的模式,這個里面帶來的市場商業(yè)機(jī)會是會遠(yuǎn)遠(yuǎn)大于傳統(tǒng)模式的。因?yàn)檫@個圖象的模式相比語音和觸控是更高維的模式,在這個里面我們獲取到的信息也是遠(yuǎn)遠(yuǎn)大于觸控和語音這樣的二維方式帶來的信息。我們現(xiàn)在看到智能家居的演進(jìn)過程三個比較明顯的變化,這個是會給我們帶來很大的商業(yè)機(jī)會。
說到這個變化的趨勢以后,我們對于目前智能家居市場大家都說了很多年,但是為什么一直沒有起來,我們也仔細(xì)的思考了一下,我們覺得有四個方面的原因。第一,左上角這塊,應(yīng)用場景分散,比如安全娛樂、家庭服務(wù)等等,還有家里面的智能設(shè)備過于分散,比如玩具、機(jī)器人、攝象頭等等,所有這些分散的應(yīng)用場景和電子設(shè)備會導(dǎo)致當(dāng)我們想把他們智能化的時候,你是很難快速復(fù)制的。第二個挑戰(zhàn),是技術(shù),在智能家居里面你要服務(wù)人,這個人是非常難以服務(wù)的,這個里面技術(shù)的挑戰(zhàn),有語音、圖象等等,我們今天要解決很多的技術(shù)難題,仍然是有很大的挑戰(zhàn)。第三個,數(shù)據(jù),數(shù)據(jù)的搜集和分析是一個很難的過程,首先,家里面每個場景都是高度分散化的,每個家庭的需求也是不一樣的。
其次我們覺得,大家可能會比較容易忽視的問題,你只是拿到大數(shù)據(jù),這其實(shí)是遠(yuǎn)遠(yuǎn)不夠的,因?yàn)槲覀兘裉鞎l(fā)現(xiàn),你家里安裝上很多的接口,你搜集到很多的數(shù)據(jù),但是這些數(shù)據(jù)很多都是沒用的數(shù)據(jù),如果不停的把這些數(shù)據(jù)上傳到云端,這會占用很多的資源,而這些數(shù)據(jù)基本都是無效的。所以我們搜集數(shù)據(jù)的時候,我們要思考,不僅僅要搜集數(shù)據(jù),而且要搜集真正有價值的數(shù)據(jù)。但是這個事情并不是這么容易做到的。第四個挑戰(zhàn),真正的用戶體驗(yàn),我們現(xiàn)在人工智能的技術(shù)得到了很快的發(fā)展,但是真正讓人滿意,讓人感覺到這個交互的方式和服務(wù)的方式非常自然,這仍然是非常大的挑戰(zhàn)。這并不是一個純技術(shù)的問題,牽涉到很多其他的問題。有了這些挑戰(zhàn),人工智能在智能生活上的普及,我們覺得一定不是一蹴而就的事情,一定需要一段時間的慢慢積累。
應(yīng)對這些挑戰(zhàn),我們地平線有自己的觀點(diǎn),第一,應(yīng)用場景分散的問題,從我們的角度來看,我必須要抓緊中間的主觀矛盾和變量,我們認(rèn)為這個主要矛盾和變量就是人,我們現(xiàn)在人工智能的技術(shù)在智能家居這個領(lǐng)域就應(yīng)該把人做透。比如說我們看安全,現(xiàn)在家里面裝很多攝象頭主要的目的是為了安全,而安全其實(shí)核心是什么呢?最主要的是想知道家里有沒有人,第二,我要知道這個人是什么人,第三,我要知道這個人的行為,他做的行為是安全的行為還是不安全的,比如小孩子進(jìn)入廚房,會不會點(diǎn)煤氣灶,這些都是不安全的行為。這些所有的都是要人做的。比如娛樂,家庭服務(wù)、健康、教育等等,就不一一舉例了,如果你好好思考的話,這個背后主要矛盾和變量就是人。我們地平線在這里是從人臉到人的行為分析,到人體的環(huán)境,以及這個人的語音和設(shè)備的交互,我們主要的核心點(diǎn)就是圍繞人,把這個技術(shù)做好。在這塊再支撐巨大的分散的智能家居的需求。
第二個是技術(shù),技術(shù)上的挑戰(zhàn),我們也是把他簡化,因?yàn)槿说慕换シ绞胶瞳@取信息的方式其實(shí)是一個融合的方式,單獨(dú)的語音和圖象,或者單獨(dú)的其他任何傳感器,都不能涵蓋所有的應(yīng)用場景。所以一定是要圖象+語音。另外圖象中間,這個視覺的價值是高維的,80%的價值信息來自于圖象,只有20%來自于語音,在技術(shù)上要完成對智能家居最好體驗(yàn)的布局,我們認(rèn)為這個必須把圖象和語音的技術(shù)融合,只是單獨(dú)的做語音和圖象是缺位的。
第三個,數(shù)據(jù),要獲取有價值的數(shù)據(jù),怎么獲取呢?這個本身是不容易做到的,我們的思路也是比較清晰,就是做嵌入式的人工智能,端+ 云的方式,端側(cè)呢,大家可以看到,他在將來的人工智能的體系里面,扮演了一個非常重要的角色,現(xiàn)在我們談到所謂的人工智能的創(chuàng)意也好,什么也好,包括很多大公司,他們其實(shí)更多的是在云端做但是端上有不可取代的價值,主要是三個方面,第一,端是不依賴于網(wǎng)絡(luò)的,不管是在家里,還是哪里,大家會發(fā)現(xiàn)家里的無限網(wǎng)絡(luò)覆蓋很難做到完美,如果是在樓下,或者是在移動的場景中,這個網(wǎng)絡(luò)的覆蓋其實(shí)是非常有挑戰(zhàn)的事情,特別是當(dāng)你牽涉到一些智能圖象處理的時候,你很難時時的把圖象傳到云端再處理回來,這個時候及時性沒有了。
還有我們怎么樣把有價值的數(shù)據(jù)傳到云端,這個就要求在端上一定要有一個自己的審核,是一個有選擇性的審核。比如我陽臺上有一個洗衣服的籃子,我就只關(guān)注這個里面衣服滿的時候,這個狀態(tài)我傳到云端。如果這個里面沒有衣服,99%的時間,這些數(shù)據(jù)是毫無意義的,就拋棄了。必須采用一個端+云的方式,這樣才有可能真正的做到最高效,而且是最有性價比的智能服務(wù)。
有了端上的智能以后,在云端可以做很多的事情,一個是可以搜集數(shù)據(jù),持續(xù)的優(yōu)化用戶的體驗(yàn)另外是每一個硬件,將來都是和手機(jī)的形態(tài)一樣,他在上面都可以下載很多的智能APP,這個硬件可能已經(jīng)脫離了原來的形態(tài)了,你買回來的時候可能是一個家電,也可能是一個機(jī)器人,但是隨著我們的升級,他可以變成任何一個東西。
當(dāng)我們真的有了這個大數(shù)據(jù),也對人的喜好了解以后,這個就不局限在家里了,當(dāng)我們?nèi)嗽谄渌胤?,到任何一個地方都可以把云端的功能使用起來。將來的智能家居市場一定是端+云的架構(gòu)。
第四個,真正的用戶體驗(yàn),這個服務(wù)人是非常難的事情,我們現(xiàn)在服務(wù)的人工智能技術(shù)在宣傳的過程中,過多的強(qiáng)調(diào)我們這個技術(shù)本身,比過去傳統(tǒng)的技術(shù)好了很多,但是我們也要意識到,真正在這個過程當(dāng)中要達(dá)到讓人滿意仍然是一個非常有挑戰(zhàn)的過程。舉個例子,語音,我們現(xiàn)在都會說我們語音可以支持遠(yuǎn)場和近場,也可以識別一些都口音的普通話,甚至是方言,但是我們在實(shí)際應(yīng)用中,我們在家里面看到很多語音的設(shè)備,如果很多人同時講話的時候,這個時候的識別率就會下降的比較厲害。
當(dāng)我們考慮場景的時候,一定要讓人非常自然的使用這個技術(shù)。圖象也是一樣,我們今天在家里面有很多人工智能的方案做人臉識別,如果你離的很近的時候確實(shí)識別的很好,但是如果離的比較遠(yuǎn),如果是走動的狀態(tài)下,如果是背光的情況下,怎么辦?這些都要解決,只有這樣用戶體驗(yàn)才能真正好,才能真正的愿意使用這個技術(shù),這個市場才能真正的起來。另外一個,我們這個技術(shù)更多的還要依賴于攝象頭做到主動的服務(wù),對這個用戶要懂他,只有懂他才能使用戶得到好的體驗(yàn)。
剛才總結(jié)了智能家居市場的一個現(xiàn)狀和發(fā)展趨勢,以及我們現(xiàn)在看到的四個挑戰(zhàn),場景非常分散,技術(shù)挑戰(zhàn)很大,如何搜集有價值的數(shù)據(jù)以及最后如何做到真正好的用戶體驗(yàn),我們也介紹了一些地平線的思考和做的事情。總的來說,我們地平線的核心點(diǎn)就一句話,我們是做嵌入式的人工智能,我們認(rèn)為這是最好的切入點(diǎn)。我們跟別的公司鮮明的區(qū)分也很簡單,很多的人工智能公司是非常優(yōu)秀和成功的,但是他們主要是依靠云端的技術(shù),我們地平線的目標(biāo)是希望讓人工智能真正的分布到每一個端上,我現(xiàn)在在智能家居這個領(lǐng)域,我們圍繞人,用最小的處理資源,比如說我們現(xiàn)在的技術(shù)可以在APP上做到我們介紹的所有的智能事情,以及將來我們很快的可以看到,包括很多公司,包括地平線研發(fā)的,基于生物學(xué)習(xí)的專用的處理器架構(gòu),用最小的資源做到真正的好的技術(shù)服務(wù),給大家?guī)碜詈玫挠脩趔w驗(yàn)。
地平線本身的定位,在這里也說一下,我們的定位其實(shí)是一個2B的公司,我們不會做2C的任何產(chǎn)品,我們地平線希望在嵌入式的設(shè)備上,有我們自己的IP,也可能有別人的IP在這個上面支撐更多的智能設(shè)備,有玩具、家電和攝象頭,我們地平線還會提供一個智能系統(tǒng)支撐平臺,這個平臺之上我們希望支撐整個行業(yè)的各個合作伙伴以及我們的客戶,由他們再 去針對各種各樣的智能生活中的場景做各種各樣好的服務(wù)和應(yīng)用。最后,帶給消費(fèi)者最方便、最快捷、最舒適的用戶體驗(yàn),達(dá)到所有人的共同目標(biāo)。
智能家居已經(jīng)成為物聯(lián)網(wǎng)浪潮下的一個重要增長市場,智能家居和物聯(lián)網(wǎng)的互聯(lián)融合也在加速。行業(yè)專家認(rèn)為,真正的連接是以用戶價值為中心的需求互聯(lián),而不是簡單的技術(shù)互聯(lián)和場景互聯(lián)。對于智能家居市場的最新熱點(diǎn)趨勢和市場技術(shù)解讀,你不能錯過電子發(fā)燒友主辦的【第六屆智能家居技術(shù)創(chuàng)新研討會】。
電子發(fā)燒友舉辦【第六屆智能家居技術(shù)創(chuàng)新研討會】,屆時邀請業(yè)內(nèi)知名大咖如微軟戰(zhàn)略顧問管震、和而泰智能董事長劉建偉、深圳易聯(lián)智能李學(xué)勇等來解讀最新智能家居云平臺、智能語音交互和智能家居市場痛點(diǎn)和最新趨勢,請直接報(bào)名。
評論
查看更多