曾就職于IBM全球咨詢服務(wù)部,作為高級(jí)咨詢顧問參與了銀行、航空、教育行業(yè)的多個(gè)客戶信息化咨詢項(xiàng)目;后加入百度深度學(xué)習(xí)研究院負(fù)責(zé)識(shí)圖產(chǎn)品,為百度IDL研究院首位AI產(chǎn)品經(jīng)理。
加入ROOBO以后,負(fù)責(zé)將ROS.AI平臺(tái)快速落地于智能家居、兒童機(jī)器人方向;截止18年上半年助力ROOBO完成了兒童機(jī)器人軟硬件方案500萬臺(tái)的出貨量,行業(yè)內(nèi)穩(wěn)居第一;同時(shí)打造童秘兒童智能平臺(tái),連接更多的兒童設(shè)備,使交互變得便捷和智能。
兒童機(jī)器人與AI的行業(yè)發(fā)展回顧
如往期一樣,在了解兒童機(jī)器人目前的整體現(xiàn)狀和如何打造一款合格的兒童機(jī)器人前,我們需要先了解一下這個(gè)行業(yè)的歷史進(jìn)程與發(fā)展。
“兒童機(jī)器人”這個(gè)概念目前其實(shí)還算比較小眾,甚至在百科上都沒有一個(gè)具體的詞條能夠完整描述它。也就是說,兒童機(jī)器人仍然沒有一個(gè)合適的定義。
因此,想要了解這個(gè)行業(yè),我們需要從產(chǎn)品入手,以產(chǎn)品共性看待行業(yè)。我們發(fā)現(xiàn),所有的兒童機(jī)器人產(chǎn)品現(xiàn)在都有一個(gè)重要的功能特點(diǎn),那就是需要傾聽兒童的聲音,并和他們交流、互動(dòng)。所以,這類產(chǎn)品最核心和關(guān)鍵的技術(shù)就是智能語音技術(shù)。而這,恰恰離不開人工智能的第三次浪潮。
從06年誕生深度學(xué)習(xí)理論技術(shù)后,短短5年時(shí)間語音識(shí)別和圖像技術(shù)便迎來了商業(yè)化時(shí)代。以2011年為節(jié)點(diǎn),微軟率先使用深度學(xué)習(xí),將語音識(shí)別正確率從75%提升到95%以上。隨后,訊飛輸入法、SIRI這樣的智能助理誕生。
最早的兒童智能機(jī)器人雛形則來源于語音識(shí)別鼻祖訊飛的一款應(yīng)用APP《開心熊寶》。這是基于手機(jī)的一款軟件,而對(duì)于硬件來說,2014年一家國(guó)外的公司打造了“JIBO”的硬件產(chǎn)品,很遺憾地,它并沒有得到量產(chǎn)的機(jī)會(huì)。
如今我們有著很多公司在共同耕耘兒童機(jī)器人市場(chǎng),不論是最初的樂橙公司、小魚在家還是如今的北京智能管家ROOBO,多多少少在設(shè)計(jì)及理念上都借鑒了他們的“老大哥”JIBO。
在各家公司紛紛進(jìn)入兒童機(jī)器人市場(chǎng)的2015年,整個(gè)行業(yè)也開始騰飛,從不足10萬的年銷量,發(fā)展到3年以后的2018年預(yù)估2000萬銷量。鐘升達(dá)分析,這樣的井噴效果不僅來自于硬件成本的降低,其次也有故事機(jī)、早教機(jī)產(chǎn)品轉(zhuǎn)型帶來的影響。
兒童機(jī)器人1.0時(shí)代:同質(zhì)化產(chǎn)品當(dāng)?shù)?/p>
作為一個(gè)擁有潛在銷量2000萬的市場(chǎng),大家普遍都會(huì)認(rèn)為兒童機(jī)器人產(chǎn)品銷售一定擁有“快速增長(zhǎng)性”和“藍(lán)?!钡奶攸c(diǎn)。
然而并不是這樣。
據(jù)鐘升達(dá)的描述,外行會(huì)認(rèn)為兒童機(jī)器人市場(chǎng)像是廣闊藍(lán)海,而從業(yè)者都深知他們所處的環(huán)境只是一個(gè)小小的魚塘,并且競(jìng)爭(zhēng)非常激烈。
這是因?yàn)椋谝?,父母?duì)兒童機(jī)器人產(chǎn)品的認(rèn)知度依然不高。父母及孩子,乃至我們廣大消費(fèi)者,在被各種影視作品及通俗文化的影響下,都會(huì)認(rèn)為:
“兒童陪伴機(jī)器人” = 哆啦A夢(mèng)或大白
第二,盡管兩種產(chǎn)品在品類上毫不相關(guān),智能音箱的“千機(jī)大戰(zhàn)”以及各種巨頭補(bǔ)貼在不斷沖擊著兒童機(jī)器人市場(chǎng)。這主要是因?yàn)樯a(chǎn)者在產(chǎn)品編輯上處理較為模糊
你能分得清誰是兒童機(jī)器人嗎?
作為主打兒童智能語音交互的產(chǎn)品,兒童機(jī)器人的核心應(yīng)當(dāng)是“技能和場(chǎng)景”。目前各種平臺(tái)也在不斷拓展著它們,我們總結(jié)來看,其實(shí)不外乎兩類。
第一類是工具型,比如咨詢天氣、其它生活信息或常識(shí)信息。第二類是資源點(diǎn)播型,比如聽兒歌,聽故事或者看動(dòng)畫片。
對(duì)此這些技能和場(chǎng)景,ROOBO專門梳理了用戶在使用它們時(shí)所占據(jù)的比例。
根據(jù)這個(gè)分析,我們可以得出在目前的兒童智能機(jī)器人時(shí)代,鐘升達(dá)稱之為“兒童智能機(jī)器人1.0時(shí)代”,無論從產(chǎn)品外觀、內(nèi)沿競(jìng)爭(zhēng)或者功能體驗(yàn)上來講,各家產(chǎn)品都處于一個(gè)非常同質(zhì)化的階段。
那么在同質(zhì)化的競(jìng)爭(zhēng)狀態(tài)下,北京智能管家ROOBO以及行業(yè)內(nèi)所有的兒童機(jī)器人企業(yè)該如何去打造差異化、有特點(diǎn)的機(jī)器人呢?
如何打造2.0時(shí)代的差異化兒童智能機(jī)器人?
深耕行業(yè)多年,北京智能管家ROOBO在積累了大量經(jīng)驗(yàn)的情況下,于今年7月推出了從軟件到硬件統(tǒng)一的開放平臺(tái)——“童秘平臺(tái)”。
“童秘平臺(tái)”的開放性來自于它可以適配各種系統(tǒng),如業(yè)界常用的安卓系統(tǒng)、Linux系統(tǒng),以及RTOS系統(tǒng)。同時(shí),在對(duì)接硬件方案伙伴上,ROOBO也將內(nèi)容云這一層面開放出來,以實(shí)現(xiàn)更多有價(jià)值的、富有教育意義的內(nèi)容覆蓋。
除了平臺(tái)與內(nèi)容外,最基本的語音對(duì)話方面,ROOBO在2.0時(shí)代總結(jié)了百度先前提出的標(biāo)準(zhǔn),即“聽清”、“聽懂”、“滿足”。
這三個(gè)方面對(duì)于成年人來說,似乎很好實(shí)現(xiàn)。然而對(duì)于兒童來講,他們正處在學(xué)習(xí)語言的階段,小到發(fā)音、大到語言邏輯的各種形式都是非常復(fù)雜的。
通過大量的語音標(biāo)注,以及結(jié)合最新的聲學(xué)模型TDNN神經(jīng)網(wǎng)絡(luò),ROOBO重新訓(xùn)練生成了專門針對(duì)垂直于兒童領(lǐng)域的ASR語音識(shí)別技術(shù)。至此,ROOBO實(shí)現(xiàn)了差異化的第一個(gè)點(diǎn):聽清。
對(duì)于“聽懂”,鐘升達(dá)講述,在大部分常見的用戶對(duì)話中,用戶的意圖遵循著“二八定律”,就是說80%的用戶,其對(duì)于產(chǎn)品功能的表達(dá)方式會(huì)集中在20%的話術(shù)上。比如說暫停歌曲,普通成年人用戶會(huì)說“暫停”、“不要播了”、“停下來”等,而兒童卻不這樣,也是和兒童的語言邏輯相關(guān)的,他們會(huì)認(rèn)為機(jī)器人并非工具,而說出“你這個(gè)歌可不可以自己停呀?”這樣的話語。
這種擬人化的語言如果用傳統(tǒng)的智能語言模板匹配很難會(huì)命中兒童的真實(shí)意圖。在這方面ROOBO又結(jié)合另外的LSTM模型進(jìn)行大量標(biāo)注,實(shí)現(xiàn)了兒童自然語言處理的神經(jīng)網(wǎng)絡(luò)。此外,他們也圍繞產(chǎn)品端進(jìn)行了定制化的迭代,保證時(shí)刻更新兒童語料。
最后一個(gè)階段是“滿足”,這一方面ROOBO和眾多內(nèi)容合作伙伴一起打造了知識(shí)庫,將目前市面上的內(nèi)容知識(shí)形成體系輸出給廣大兒童。
其實(shí),僅僅包含“聽清”、“聽懂”和滿足,兒童智能機(jī)器人仍然和智能音箱無法形成有效差異化。
對(duì)此,鐘升達(dá)表示,ROOBO給出了一個(gè)絕佳的方式。因?yàn)閮和谔幱谡Z言學(xué)習(xí)的關(guān)鍵時(shí)刻,只是“磨耳朵”對(duì)于他們來說幫助不大,這是一種輸入。更有效的互動(dòng)應(yīng)當(dāng)是輸入與輸出相結(jié)合。
因此ROOBO給孩子們提供了“磨嘴巴”的功能,即是由機(jī)器人在和孩子交流的過程中根據(jù)內(nèi)容主動(dòng)發(fā)問,例如當(dāng)孩子提問:“你有家人嗎?”機(jī)器人回答:“沒有,我是機(jī)器人,你有家人嗎?家里有幾口人呢?”
通過一些具有條例和邏輯的回復(fù),鍛煉兒童的語言意識(shí)。這就是2.0時(shí)代的關(guān)鍵——圍繞語言的主動(dòng)交互。
關(guān)于兒童機(jī)器人的未來
除了分享ROOBO關(guān)于兒童機(jī)器人2.0時(shí)代所做的事情,鐘升達(dá)還對(duì)未來的兒童機(jī)器人發(fā)展提供了更多想法。
這里,具體在三個(gè)趨勢(shì)上面會(huì)有所表現(xiàn):
一是IP化,比如一些家喻戶曉的動(dòng)漫形象,如小豬佩奇、小黃人等,以此增強(qiáng)產(chǎn)品的認(rèn)知度。
二是內(nèi)容互動(dòng)多元,就如上面講到的,機(jī)器人會(huì)主動(dòng)引導(dǎo)孩子表達(dá),之后孩子也會(huì)發(fā)表他關(guān)于上下文的想法,以此實(shí)現(xiàn)教學(xué)性的互動(dòng)。
三是未來的兒童智能機(jī)器人一定是既能聽又能看同時(shí)具有更強(qiáng)感知能力的產(chǎn)品,它可以有效監(jiān)督,或者督促孩子學(xué)習(xí)。
現(xiàn)場(chǎng)答疑環(huán)節(jié)
Q1: 兒童機(jī)器人如此同質(zhì)化,我該如何選擇合適孩子的產(chǎn)品?
答:對(duì)于目前階段,家長(zhǎng)應(yīng)當(dāng)選擇更具有優(yōu)質(zhì)內(nèi)容的平臺(tái),語言交互方面應(yīng)當(dāng)考慮關(guān)注百科問答的質(zhì)量效果。
Q2: 兒童語音分析的過程中,最困難的是什么?
答:最困難的地方是有些小孩子的說話連大人也聽不懂,所以在語音標(biāo)注的時(shí)候所需要花費(fèi)的成本也會(huì)比較高。另外就是兒童本身的表達(dá)也會(huì)很不標(biāo)準(zhǔn),需要大量的語料積累才能達(dá)到較好的意圖識(shí)別。
Q3: 作為家長(zhǎng),我為什么要購買兒童機(jī)器人?
答:這個(gè)我覺得從兒童機(jī)器人的幾個(gè)方面來看,一個(gè)是愿景出發(fā),兒童機(jī)器人本身的出發(fā)點(diǎn)是希望陪伴小孩子學(xué)習(xí)成長(zhǎng),而手機(jī)上內(nèi)容雖然多,但是畢竟不是適合小孩子的專屬產(chǎn)品。二是兒童機(jī)器人從硬件的配置上來看,未來一定會(huì)有更多的可運(yùn)動(dòng)類的機(jī)器人出現(xiàn),其主動(dòng)交互的能力也會(huì)遠(yuǎn)遠(yuǎn)超過手機(jī),比如陪伴小孩子學(xué)習(xí),假如小孩子不愿意學(xué),跑開了,手機(jī)能感并追隨小孩子嗎?不太可能,因?yàn)橛布窒蘖似淠芰Γ俏磥韮和瘷C(jī)器人有可能。
Q4:目前的早教智能產(chǎn)品市場(chǎng)還是故事機(jī)賣得比較好,兒童智能機(jī)器人沖擊這個(gè)市場(chǎng)的優(yōu)勢(shì)有哪些?
答:剛才提到一個(gè)很重要的點(diǎn),故事機(jī)是一個(gè)被動(dòng)交互的產(chǎn)品,兒童機(jī)器人未來要拉開差距,需要從主動(dòng)交互上下功夫。把和孩子的交流變?yōu)殡p向的,而不是被動(dòng)響應(yīng)主人的請(qǐng)求。這個(gè)很重要。另外一點(diǎn)就是需要把硬件成本控制好,降低成本。
Q5:外形或者內(nèi)容上,未來會(huì)考慮引入一些IP元素嗎?業(yè)界的趨勢(shì)是怎樣的?
答:IP化這件事兒一直都有企業(yè)嘗試,但是面臨的問題是一是授權(quán)成本比較高,二是IP化除了外觀外,也需要從機(jī)器人本身的內(nèi)涵下功夫,比如IP的聲音是否能有效合成,IP的機(jī)器人畫像是否能做的和原型足夠的匹配。當(dāng)然,最重要的是企業(yè)自身的內(nèi)容和渠道是否能夠讓消費(fèi)者買單。
-
AI
+關(guān)注
關(guān)注
87文章
29886瀏覽量
268174 -
智能機(jī)器人
+關(guān)注
關(guān)注
17文章
862瀏覽量
82179
原文標(biāo)題:ROOBO鐘升達(dá):如何從0到1打造爆款兒童智能機(jī)器人
文章出處:【微信號(hào):robotplaces,微信公眾號(hào):機(jī)器人創(chuàng)新生態(tài)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論