0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

天貓精靈大升級 搭配“火眼”變得能聽會看

454398 ? 來源:網(wǎng)絡(luò)整理 ? 2018-03-28 09:52 ? 次閱讀

智能音箱從能聽到會看,多模態(tài)交互將成為趨勢。

8 個月時(shí)間,在天貓精靈 X1 智能音箱從發(fā)售到銷量 200 萬后,阿里巴巴人工智能實(shí)驗(yàn)室舉行了 2018 年的第一場發(fā)布會(3 月 22 日),而這一次發(fā)布的核心產(chǎn)品,有點(diǎn)出乎大家意料。

用一個 49 元的手機(jī)支架,和幾乎人人都有的智能手機(jī),天貓精靈進(jìn)行了一次變身,不但變得比以前更加聰明,還擁有了全新的“多模態(tài)感知系統(tǒng)”。作為 2017 年的行業(yè)黑馬,本次發(fā)布會上讓人激動的這件新品不再是硬件,而是重量級的系統(tǒng)升級——AliGenie 2.0,我們不妨先來看看這段官方視頻演示:

AI 變奏曲:智能音箱從能聽到會看

毫無疑問,當(dāng)天發(fā)布會上的主角正是阿里巴巴人工智能實(shí)驗(yàn)室的 AliGenie 2.0,它加入了最新的 AI 視覺系統(tǒng),并嘗試去融入更多情感操作。阿里巴巴人工智能實(shí)驗(yàn)室負(fù)責(zé)人淺雪稱之為“天貓精靈火眼”。和去年 7 月推出的 AliGenie 1.0 最大的不同在于,2.0 版本從原本能聽能說,變成了如今的能看能聽能說。

能看是系統(tǒng)升級的重點(diǎn),“從觸覺到聽覺,再到視覺,最后是情感反饋,多模態(tài)交互是 AliGenie 2.0 的核心”,對于此次系統(tǒng)升級,淺雪認(rèn)為它最大的不同是人機(jī)交互的變化,尤其是因此產(chǎn)生的與眾不同的用戶體驗(yàn)。

阿里巴巴人工智能實(shí)驗(yàn)室負(fù)責(zé)人 淺雪

搭載“火眼”的天貓精靈,在原本的天貓精靈 X1 上增加了一個手機(jī)支架,通過把手機(jī)連接到天貓精靈 App,手機(jī)屏幕出現(xiàn)了一只可以交互的“天貓”,通過手觸摸,它可以簡單和人互動。

這只“寵物貓”擁有 AI 識圖能力。依靠手機(jī)前置攝像頭,天貓精靈有了能“看懂”周圍事物的“眼睛”,它可以識別 2D 和 3D 信息。具體來說,有三個重要能力加入。

第一,當(dāng)你手拿兒童故事書,或者識字卡靠近,詢問天貓精靈“這是什么”時(shí),它可以“看到”并立即為你朗讀卡片和故事書的內(nèi)容。

其次,通過連接阿里健康的數(shù)據(jù)信息,天貓精靈有了“判斷”藥品的能力,可以迅速識別 40000 種中國家庭常用藥。當(dāng)你手拿藥品盒子在手機(jī)攝像頭前詢問時(shí),這只“貓”會手拿藥盒,告訴你它的名稱,功效甚至有效周期。

第三,同時(shí)也是最讓人驚訝的能力,天貓精靈具備了基礎(chǔ)的 3D 圖像識別的能力。當(dāng)手持蔬菜、水果等物品靠近攝像頭詢問時(shí),它可以很快告訴你這是什么物品。

和前兩種的 2D 圖像識別不同,3D 識別物體要做到的是不論你用何種角度拿著物品靠近攝像頭,它都能判斷出物體是什么,按照產(chǎn)品總監(jiān)釋空的解釋,這(難度)要比 2D 識別大得多。

因?yàn)?3D 識別不僅在考驗(yàn)系統(tǒng)對周圍環(huán)境光線的適應(yīng)、同時(shí)也要對你手持物體角度進(jìn)行準(zhǔn)確把握,還要有足夠的數(shù)據(jù)信息可以搜尋出物體。比如在你拿著一個已經(jīng)發(fā)霉變色的西蘭花時(shí),要想被識別出來,就必須知道這還是西蘭花,這對于機(jī)器來說并不容易。所以目前,天貓精靈能識別出的蔬菜水果不多,只有幾十種,但這種能力卻對于將來識別更多物品(包括商品),甚至于人臉都具有重要意義。

此外,發(fā)布會很重要的一部分在于天貓精靈的邊界擴(kuò)展,看到前面幾個功能也許有人能猜到,閱讀故事書,教人讀書寫字,這是面向兒童的能力。而幫你識別藥品,告訴你藥品功效,再告訴你還有多久會過期,這是更貼近老人的能力。

因此天貓精靈不但聯(lián)合了國內(nèi) 12 家少年兒童出版社,對市面上 117 套兒童讀物以及繪本進(jìn)行了有聲讀物化,還將通過馬云公益基金會將天貓精靈帶到更多偏遠(yuǎn)地區(qū),為當(dāng)?shù)貙W(xué)校教育以及兒童陪伴問題提供新的解決思路。

盡管發(fā)布會還另外帶來了阿里巴巴人工智能實(shí)驗(yàn)室的路由器、投影儀以及迷你版天貓精靈,但最核心的主角無疑就是全新升級的 AliGenie 2.0 系統(tǒng)。這不由得令人好奇,當(dāng)國內(nèi)外廠商紛紛升級了帶屏幕的智能音箱時(shí),為何阿里巴巴選擇了這樣一個“非常規(guī)”的升級方式?不是通過賣新的產(chǎn)品,而是用 App 和用戶自己的手機(jī),這樣一個更加“軟著陸”的方式來使用新產(chǎn)品(也是新系統(tǒng))呢?

殊途同歸的多模態(tài)交互

一個現(xiàn)狀是,帶有屏幕的智能音箱價(jià)格與人們期望存在差距。市面上帶屏幕的智能音箱,少則近千元,多則數(shù)千元??梢哉f在目前階段,當(dāng)用戶考慮用數(shù)千元買一個帶屏幕的智能音箱時(shí),他們會猶豫,并會和一些其它成熟產(chǎn)品(如 iPad 等)比較其是否值得?

這也是擺在包括淺雪在內(nèi)的團(tuán)隊(duì)成員面前同樣的問題,因此需要考慮的就是:如何用極低的成本,盡量做到現(xiàn)階段能實(shí)現(xiàn)的最優(yōu)體驗(yàn)?團(tuán)隊(duì)內(nèi)部對此曾出現(xiàn)過分歧,用釋空的說法,最終他們認(rèn)為,由于目前階段帶屏幕的智能音箱產(chǎn)品不具有足夠的議價(jià),因此就做出了用手機(jī)來完成這些的方案。

這讓人想起了谷歌在 VR 推進(jìn)早期曾大力推行的產(chǎn)品“CardBoard”。

紙板做的廉價(jià) VR 眼鏡——Google CardBoard

在 VR 產(chǎn)業(yè)剛剛起步階段,市面上 VR 產(chǎn)品不但價(jià)格貴,體驗(yàn)也并不優(yōu)秀,于是谷歌采取了用廉價(jià)紙盒做 VR 眼鏡的策略,滿足了大家在好奇期的想法,并成功向大眾普及了 VR 這一概念,這種方式不得不說是有其必要性的。

“我們最關(guān)注的事情是如何讓每個用戶用最低的成本入門就能完全體驗(yàn)。”淺雪說,這種觀點(diǎn)最終指向的目標(biāo)是給每個人做有用有價(jià)值的人工智能,所以嘗試出這樣的方案在意料之中。

但在大方向上,智能音箱不應(yīng)該僅僅只有語音交互,應(yīng)該是語音、視覺、情感多模態(tài)交互的觀點(diǎn),這卻是 AliGenie 系統(tǒng),乃至整個智能音箱領(lǐng)域目前達(dá)成的一個基礎(chǔ)共識。

的確,智能音箱優(yōu)點(diǎn)很多,但嘗試過的用戶都會認(rèn)為它不夠完美,聲音交互的特性讓它在很多場景中不夠靈活,而要解決這個問題,利用屏幕也許是一個途徑,今年開年來,伴隨 CES 2018 展會,我們見到了國內(nèi)外眾多帶有屏幕的智能音箱,谷歌甚至組建了一個“Smart Display”聯(lián)盟,想要讓這一趨勢迅速蔓延開來。

從左到右,LG、聯(lián)想、JBL 的 Smart Diaplay 產(chǎn)品

在淺雪看來,阿里人工智能系統(tǒng) AliGenie 2.0 系統(tǒng)升級,它的“能力比一塊屏幕更重要”。目前階段下,通過一個 App 和手機(jī)就能體驗(yàn)到的事情,既能讓用戶擁有更好的心理預(yù)期,又能在吸取經(jīng)驗(yàn)進(jìn)一步打磨未來產(chǎn)品,這樣的嘗試能讓更多用戶理解,有了屏幕交互的智能音箱不同于 iPad,語音控制和屏幕觸控也不是互相替代,而是互補(bǔ)關(guān)系。

一旦有了這種體驗(yàn),大家就會發(fā)掘出自己真正需要的到底是怎樣的智能音箱。如發(fā)布會現(xiàn)場演示的功能一樣,教育兒童,可以通過看到卡片和圖書來給孩子講故事;幫助老人,可以通過看到藥品盒子就說出功能功效和截止日期。這種輕度體驗(yàn)?zāi)茉谏钪新囵B(yǎng)人們對于智能音箱的新的認(rèn)知。

如果說 2017 年是國內(nèi)智能音箱競賽元年,那么站在賽道上的阿里巴巴無疑通過雙 11 的 100 萬臺銷量成為了行業(yè)黑馬。而隨著 AliGenie 2.0 的推出,2018 年人工智能產(chǎn)品將更具擴(kuò)展性,多模態(tài),讓人更自如的交互無疑將成為接下來各大廠商關(guān)注的重點(diǎn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6080

    瀏覽量

    104353
  • vr
    vr
    +關(guān)注

    關(guān)注

    34

    文章

    9619

    瀏覽量

    149410
  • 智能音箱
    +關(guān)注

    關(guān)注

    31

    文章

    1781

    瀏覽量

    78279
收藏 人收藏

    評論

    相關(guān)推薦

    無需網(wǎng)關(guān),支持貓精靈直接控制,擁有藍(lán)牙m(xù)esh 組網(wǎng)功能

    可對接貓精靈等智能音箱,適用于多種智能家居應(yīng)用場景。 安信可藍(lán)牙模塊主要分為PB系列、TB系列、TG系列,今天給大家?guī)砀叻€(wěn)定性的TB系列。 01產(chǎn)品簡介 TB-01/TB-02/TB-03F/TB-04/TB-05 ●關(guān)鍵詞:無需網(wǎng)關(guān)支持
    的頭像 發(fā)表于 06-24 15:56 ?360次閱讀
    無需網(wǎng)關(guān),支持<b class='flag-5'>天</b><b class='flag-5'>貓精靈</b>直接控制,擁有藍(lán)牙m(xù)esh 組網(wǎng)功能

    如何清除ESP32 BLE的Mesh信息?

    貓精靈貓精靈這邊有一個三元組數(shù)據(jù),如下所示: Product ID(十進(jìn)制)Product SecretMac地址 1345F769024ACE5E3A67CC3C3C58B16
    發(fā)表于 06-18 06:07

    符合BLE 5.0,智能手機(jī)Mesh組網(wǎng),可對接貓精靈的藍(lán)牙模組

    可對接貓精靈等智能音箱,適用于多種智能家居應(yīng)用場景。 安信可藍(lán)牙模塊主要分為PB系列、TB系列、TG系列,今天先給大家?guī)砀咝詢r(jià)比的PB系列。 01產(chǎn)品簡介 PB-01/PB-02 ●關(guān)鍵詞:采用藍(lán)牙5.0協(xié)議、支持通過智能手機(jī)組建mesh網(wǎng)絡(luò) ●應(yīng)用場景:主要應(yīng)用于智
    的頭像 發(fā)表于 06-11 14:25 ?377次閱讀
    符合BLE 5.0,智能手機(jī)Mesh組網(wǎng),可對接<b class='flag-5'>天</b><b class='flag-5'>貓精靈</b>的藍(lán)牙模組

    光速進(jìn)化!易萬兆光模塊全面升級

    ·光通信宣布10G SFP+/25G SFP28系列光模塊產(chǎn)品進(jìn)行了全新升級,旨在為客戶提供更優(yōu)質(zhì)、更高效、更可靠的光通信解決方案。這次升級不僅是技術(shù)的突破,更是對未來光通信發(fā)展趨勢的深刻洞察和精準(zhǔn)把握。
    的頭像 發(fā)表于 05-29 14:26 ?218次閱讀
    光速進(jìn)化!易<b class='flag-5'>天</b>萬兆光模塊全面<b class='flag-5'>升級</b>

    求助,關(guān)于cubemx升級和Pack升級問題求解

    cubemx使得stm32開發(fā)變得容易了許多,這是非常難得的,但是關(guān)于這個cubemx的升級和對應(yīng)pack的安裝我有點(diǎn)疑問: 之前我使用cubemxV4.10+F4pack v1.8.0,創(chuàng)建了一個
    發(fā)表于 05-11 08:02

    IAP在線升級,當(dāng)STM32f107識別U盤時(shí),U盤使用多次后識別過程會變得很慢為什么呢?

    本人在做IAP在線升級,當(dāng)STM32f107芯片識別U盤時(shí)候,U盤使用多次后,識別過程會變得很慢,這是為什么呢?是U盤老化還是芯片原因呢?
    發(fā)表于 03-21 07:03

    智慧覆冰精靈監(jiān)測裝置

    智慧覆冰精靈監(jiān)測裝置 智慧覆冰精靈監(jiān)測裝置是一種應(yīng)用于電力系統(tǒng)的新型監(jiān)測設(shè)備,主要用于實(shí)時(shí)監(jiān)測輸電線路的覆冰情況,保障電力系統(tǒng)的安全穩(wěn)定運(yùn)行。該裝置結(jié)合了高精度的傳感器技術(shù)、通信技術(shù)以及數(shù)據(jù)分析技術(shù)
    的頭像 發(fā)表于 03-20 14:41 ?293次閱讀

    導(dǎo)線精靈——導(dǎo)線覆冰智能識別監(jiān)測裝置

    導(dǎo)線精靈又叫觀冰精靈、覆冰精靈,顧名思義,可通過工業(yè)攝像機(jī)采集的線路覆冰前后圖像,通過算法來比較覆冰前后圖像的便捷輪廓來預(yù)測輸電線路覆冰的厚度,了解線路覆冰狀態(tài),并且集溫度、弧垂、氣象、視頻等傳感
    的頭像 發(fā)表于 01-18 10:33 ?511次閱讀
    導(dǎo)線<b class='flag-5'>精靈</b>——導(dǎo)線覆冰智能識別監(jiān)測裝置

    HLK-B35串口轉(zhuǎn)WiFi模塊的應(yīng)用案例

    HLK-B35串口轉(zhuǎn)WiFi模塊,自帶2.4G WiFi + BLE5.0 藍(lán)牙,支持AP、STA及BLE混合模式,價(jià)格低至個位數(shù),支持接入阿里云,定制版本可接入貓精靈,在國內(nèi)外均有多款成熟案例。
    的頭像 發(fā)表于 12-25 10:37 ?964次閱讀

    小Q精靈微氣象產(chǎn)品使用說明

    電子發(fā)燒友網(wǎng)站提供《小Q精靈微氣象產(chǎn)品使用說明.docx》資料免費(fèi)下載
    發(fā)表于 12-25 09:24 ?0次下載

    貓精靈誕生記——如何在互聯(lián)網(wǎng)公司做硬件》寶書讀后感

    如下: 三、內(nèi)容精讀 在買第一臺貓精靈之前,那時(shí)候正在推方糖,好像就幾十塊吧,我的想法是,貓精靈語音音箱才幾十塊錢,肯定是粗制濫造,我才不愿意買一個“電子垃圾”回家,結(jié)果有一次機(jī)
    發(fā)表于 11-20 10:59

    貓精靈誕生記——如何在互聯(lián)網(wǎng)公司做硬件》+消費(fèi)電子開發(fā)實(shí)踐的指導(dǎo)性書籍

    首先,非常感謝發(fā)燒友論壇能夠提供本次書籍評測的活動,并及其的有幸能夠獲得這次評測的機(jī)會。 做為貓精靈千萬用戶的其中一員,深切的感受到貓精靈的快速進(jìn)步。從2017年上市至今已有超過千
    發(fā)表于 10-30 22:37

    百度發(fā)布全新AI互動式搜索 簡單搜索AI升級

    搜索APP。百度旗下簡單搜索17日大升級,簡單搜索,首個AI互動式搜索引擎,能聽會看,聰明懂你。全新的百度搜索為用戶帶來全新的搜索體驗(yàn)。回答更靈活、結(jié)論更清晰、更懂邏輯。 在簡單搜索不管用戶輸入的問題有多長有多復(fù)雜,簡單搜索都會竭盡所能直接給你答案;而且用戶可以和搜索對話
    的頭像 發(fā)表于 10-17 12:34 ?1192次閱讀

    貓精靈誕生記——如何在互聯(lián)網(wǎng)公司做硬件》+ 理論結(jié)合實(shí)踐-難得的介紹硬件產(chǎn)品開發(fā)的好書(五星推薦)

    前言 一開始看到本書名《貓精靈誕生記——如何在互聯(lián)網(wǎng)公司做硬件》猜測應(yīng)該是一本講互聯(lián)網(wǎng)項(xiàng)目案例的書,可能就拿來當(dāng)小說看看即可。直到拿到本書看到目錄內(nèi)容,才發(fā)現(xiàn)出乎意料,本書實(shí)際是一本干貨滿滿
    發(fā)表于 10-11 22:26

    貓精靈語音模組(MSV-BEM-V01023)分享

    MSV-BEM-V01023模組是一款集成高性能WIFI/BT/MESH模組,支持IEEE 802.11 b/g/n的WiFi協(xié)議和BT5.0。模組主要適用于智能家電/智能家居等智能物聯(lián)網(wǎng)應(yīng)用,可實(shí)現(xiàn)語音控制、藍(lán)牙播放和LE MESH應(yīng)用。
    的頭像 發(fā)表于 10-08 14:16 ?895次閱讀
    <b class='flag-5'>天</b><b class='flag-5'>貓精靈</b>語音模組(MSV-BEM-V01023)分享