從 1 月份在 CES 發(fā)布全球首款屏幕指紋手機 X20 Plus UD,到 2 月份發(fā)布集超高屏占比、升降式前置攝像頭、半屏屏幕指紋等「黑科技」于一身的概念機 APEX,再到兩周前發(fā)布驚艷程度不輸 APEX 的「量產(chǎn)概念機」NEX 以及剛剛展示的 vivo ToF 3D超感應技術,vivo 用一個個領先行業(yè)的技術在過去的幾個月持續(xù)「刷屏」。
與此同時,在最近熱門的手機 AI 領域,vivo 也做出來了不少值得一提的東西。
在今年 3 月底發(fā)布的主力產(chǎn)品 X21 上,vivo 推出了叫做 Jovi(Enjoy vivo‘s AI)的 AI 助理,包含了智慧引擎、智慧場景、智慧識屏、智慧桌面、智慧駕駛在內的 5 大功能。
經(jīng)過兩個多月的努力,到了 NEX 這一代產(chǎn)品上,vivo 對 Jovi 進行了全面的升級,大幅擴充了 Jovi 的「技能包」,更加充分地利用了手機的 AI 能力。
這一切要先從一顆按鍵說起。
一顆按鍵引發(fā)的思考
按鍵是手機交互的第一層級,它高于觸摸操作,可以讓用戶在不接觸手機屏幕的情況即可完成特定的操作。
目前智能手機中最常見的設計是電源鍵、音量加、音量減三大「金剛」,除此之外,一些手機廠商也嘗試增加額外的按鍵讓用戶更快捷地完成部分操作,比如 iPhone 上的靜音按鍵、一加手機上的三段式模式按鍵、錘子手機的「閃念膠囊」鍵、索尼手機上的實體拍照鍵、三星手機的 Bixby 按鍵。
在 NEX 的機身左側,vivo 也增加了一顆實體按鍵,叫做「Jovi AI 獨立按鍵」。
顧名思義,這顆按鍵是用來啟動 Jovi 的,具體的功能有兩個:長按啟動 Jovi 智能語音助手,短按啟動 Jovi 智慧識屏。
Jovi 智能語音助手
我們先從 Jovi 智能語音助手說起。
大家知道,對于智能手機來說,智能語音助手早就算不上什么新鮮功能了,蘋果早在 2010 年發(fā)布的 iPhone 4S 上就搭載智能語音助手 Siri。之后,谷歌、亞馬遜、微軟、三星以及眾多國產(chǎn)手機廠商也紛紛推出了自家的語音助手。
作為一位「新人」,Jovi 智能語音助手有兩個特別的地方:第一個是喚醒方式,第二個是可實現(xiàn)的功能。
Jovi 智能語音助手有兩種喚醒方式,第一種是按住側面的 Jovi AI 獨立按鍵同時來說話,第二種是用喚醒詞進行遠場語音喚醒。
Jovi 提供了兩個喚醒熱詞,分別是擬人的「小 V 小 V」和更加國際范兒的「Hi,Jovi」,用戶在錄入自己的語音后,即可通過自己的語音來喚醒 Jovi。為此,NEX 內置了一顆專屬的 S801 AI 語音芯片,日常使用中可以以極低的功耗待機,在聽到用戶的聲音后快速進行響應。
功能方面,除了查天氣、設鬧鐘、設置日程提醒、搜索音樂、聽新聞等語音助手的基本功能,Jovi 智能語音助手還可以完成包含了 app 內多個步驟的復雜指令。
以生活中常見的微信發(fā)紅包功能為例,Jovi 智能語音助手已經(jīng)可以完成「給德赫亞發(fā) 5 元紅包并留言恭喜西班牙小組第一晉級」這種操作。
這句話中,包含了打開微信、在聯(lián)系人中搜索「德赫亞」、點擊聯(lián)系人頭像、點擊發(fā)消息、點擊對話框右下角的加號、點擊紅包、在金額中輸入「5」、金額下面的對話框中輸入「恭喜西班牙小組第一晉級」、點擊「塞錢進紅包」等接近 10 個步驟。
為了實現(xiàn)這個復雜的指令,除了需要強大的深度自然語言理解能力,還需要在應用層和主流 app 進行打通,目前 Jovi 已經(jīng)覆蓋了包括導航、社交、音樂、視頻、旅行、購物、天氣、打車等在內的多個頭部 app,包括大家熟悉的百度地圖、京東、淘寶、微信、大眾點評、QQ 音樂、滴滴出行等常用 app。
除了這些 vivo 官方準備好的「技能包」,用戶還可以根據(jù)自己的需求來為 Jovi 語音助手定制屬于自己的功能。
打開 NEX 預裝的 Jovi 語音 app,在右上角可以看到一個「教」的字樣,點開后就可以呼出 Jovi 的命令教學功能了。
在這里,用戶可以添加專屬的語音指令,然后為它定制自己所需要的功能,目前 Jovi 可以支持單個應用內的「點擊」以及「文本輸入」這兩種屬性的操作,已經(jīng)可以覆蓋大部分的 app 內功能,vivo 表示之后會讓 Jovi 支持更多屬性的操作。
如果你懶得「手把手」教 Jovi,還可以直接使用 Jovi 內建的「命令廣場」功能,這里匯集了用戶分享的自己教 Jovi 學會的語音指令。
目前「命令廣場」里已經(jīng)有了不少頗為實用的指令,比如「我要看世界杯」(打開優(yōu)酷,點擊世界杯專題),「支付寶收能量」(打開支付寶,點擊更多、財富管理、螞蟻森林),「招行信用卡還款」(打開招商銀行,點擊信用卡還款)。
未來,隨著 Jovi 智能語音助手的用戶越來越多,「命令廣場」的內容會快速得到豐富,vivo 也會選擇將受用戶歡迎的指令直接集成到 Jovi 的默認功能中,從而讓 Jovi 的功能更快速度地進行迭代和進化。
Jovi 智慧識屏
聊完 Jovi 智能語音助手,我們來看一下 NEX 側面 AI 按鍵的另外一個功能:短按呼出 Jovi 智慧識屏。
和智能語音助手類似,識別屏幕內容也不是什么新功能,比較早的嘗試可以追溯到谷歌在 Android 6.0 時發(fā)布的 Now On Tap 功能。到了 AI 時代,通過使用大量的數(shù)據(jù)對神經(jīng)網(wǎng)絡模型進行訓練,手機在圖像和文本識別的速度和準確性上有了巨大的提高。
NEX 搭載的是高通最新的旗艦 SoC 驍龍 845,利用配套的 AI Engine 提供的強大的 AI 運算能力,NEX 可以快速完成對屏幕內容的準確識別。不過能識別出內容只是一個前提,Jovi 智慧識屏的不同之處在于它的「智慧」部分。
在按下這顆 AI 按鍵后,Jovi 智慧識屏能夠根據(jù)屏幕上的內容,智能地進行識別。
當你在查看一張花的照片的時候,Jovi 智慧識屏會識別花的名稱并給出相關的信息。當你在看一張產(chǎn)品照片的時候,Jovi 智慧識屏又會識別出產(chǎn)品的型號并列出淘寶的購買鏈接。當你在閱讀文章的時候,Jovi 智慧識屏會將文字根據(jù)語義智能地分開,方便用戶精確選擇文字。
此外,如果屏幕上包含了多種文字信息,Jovi 智慧識屏還可以智能地對人名地名等專有名詞、電話號碼、日常安排、快遞單號等信息進行提取,將不同類型的信息匯總成一個個簡潔清晰的小卡片,方便用戶查閱。
Jovi 智慧識屏還可以和更多的信息和功能進行聯(lián)動,比如當你和朋友在微信上約看電影,Jovi 智慧識屏可以智能地展示出最近的行程,電影的介紹資料、評分,甚至是去電影院的導航信息,所有操作均在一個界面進行展示,大幅提高效率。
有了這些「智慧」的功能加入,Jovi 智慧識屏所能做的已經(jīng)遠不是一個簡單的「識屏」,而是更加接近一個無聲的個人助理,它可以根據(jù)屏幕正在顯示的信息給你自動「整理」出你需要的東西。
智慧場景、智慧桌面
除了 Jovi 智能語音助手、Jovi 智慧識屏這兩個重要新增功能,Jovi 智慧場景、智慧桌面等原有的智能功能也得到了進一步的完善。
Jovi 智慧場景位于通知欄的右上角,可以根據(jù)信息智能地生成卡片并在必要時推送,覆蓋的信息有天氣、交通、日常、電影、酒店、運動、快遞、紅包、賽事等等,而智慧桌面則位于桌面負一屏,這里包含了多種由 vivo 和第三方提供的聚合了多重信息的卡片,其中也包括了 Jovi 智能場景智能生成的事件。
值得一提的是,在最近的更新中,vivo 特別優(yōu)化了 Jovi 在世界杯期間的體驗。
在 Jovi 智慧場景中,用戶可以實時查看賽事比分,也可以點擊進去看實時的文字和視頻直播(接入的是優(yōu)酷)。此外,用戶還可以選擇自己喜愛的球隊,Jovi 會根據(jù)比賽安排提醒你觀看直播,同步賽況。
在 NEX 上,vivo 還進一步提高了 AI 對拍照相關體驗的加成。
在拍照時,NEX 可以快速識別場景然后進行針對性的參數(shù)調整,在遇到逆光場景時,NEX 可以根據(jù)場景只能選擇多幀合成張片的數(shù)量,進一步提升逆光拍照效果,可以實現(xiàn)高達 11.3eV 的動態(tài)范圍。
在 NEX 自帶的相冊中,vivo 也賦予了更多的 AI 元素,比如使用 AI 算法自動將照片根據(jù)地點、時間、事件、照片親密度等維度自動聚合,基于 AI 算法和圖像識別技術提出的關鍵詞來通過關鍵詞快速搜索照片。
AI 背后的高通 AI Engine
要實現(xiàn)以上這些和 AI 相關的功能,需要有一個強大的硬件平臺作為支撐,而這個支撐就是高通 AI Engine(AIE)。
今年的 2 月 21 號,在 MWC 2018 開幕前,高通正式推出了自家的人工智能引擎 AI Engine(Qualcomm Artificial Intelligence Engine,AI Engine),用于提高設備端(比如采用驍龍 SoC 的手機)上 AI 相關的運算能力。
AI Engine 包含了 3 個硬件和 3 個核心軟件,硬件部分為 CPU、GPU、DSP 三個部分,通過配套的驍龍神經(jīng)處理引擎(NPE)軟件框架,可以幫助開發(fā)著根據(jù)任務的需要,從 DSP、GPU、CPU 中智能選擇合適的內核。
在此基礎上,高通和多家算法提供商聯(lián)合推出了多個利用 AI Engine 的應用優(yōu)化,比如商湯科技和曠視 Face++提供的多種預先訓練的用于背景虛化、面部解鎖、場景識別的神經(jīng)網(wǎng)絡,虹軟提供的單攝和雙攝算法,創(chuàng)通聯(lián)達針對人工智能視覺用例和終端提供完整的解決方案,而騰訊、百度等云服務廠商也在利用 AI Engine 進行應用優(yōu)化。
目前支持高通 AI Engine 的 SoC 有驍龍 845、835、820、660、710,早在三月份發(fā)布的 X21 上,vivo 就使用了驍龍 600 的 AI Engine 引擎,這也是行業(yè)最早使用 AI Engine 的智能手機之一。而相比起驍龍 660,NEX 旗艦版上采用的驍龍 845 在 AI 性能上又有了數(shù)倍的提升,為 NEX 的 AI 功能提供了更加充裕的硬件基礎。
除了高通,在 NEX 的 AI 方案中,還可以看到很多行業(yè)頭部「玩家」的名字。
在語音方面,vivo NEX 搭載了由「婁氏公司」提供的聲音采集、話筒、音響等硬件處理芯片,這讓 NEX 成為全球唯一一家配置語音硬件芯片的手機,為 Jovi 智能語音助手的體驗打下了更好的硬件基礎。此外,vivo 還與國內的訊飛和百度達成合作,來提高 NEX 的自然語言理解能力,讓 NEX 可以識別復雜的語音指令。
以解決用戶需求為出發(fā)點的實用派 AI
過去一年里,手機行業(yè)有兩個趨勢最為顯著,一個是屏占比的不斷提高,一個是全面的 AI 化。
相比起屏占比提高帶來的視覺沖擊,手機 AI 帶來的體驗要「隱性」不少,甚至在一些手機廠商前期對 AI 的過度宣傳下,一度被不少消費者認為是個「噱頭」。不過在高通、海思等上游廠商以及 vivo 等手機廠商的聯(lián)合推動下,手機 AI 正在快速發(fā)展,AI 對用戶日常體驗的加成正在越來越明顯。
在這一波的手機 AI 大潮中,vivo 是行動最早、重視程度最高的廠商之一。在保持技術前瞻性的同時,vivo 在 AI 應用上更加強調解決用戶的實際需求。
這次 NEX 上搭載的 Jovi 智能語音助手和 Jovi 智慧識屏就是兩個典型的應用,語音助手和識屏都不是開創(chuàng)性的功能,不過通過和 AI 的結合,vivo 把它落地成了更多實用的功能,讓用戶可以通過方便地按下手機側面的獨立按鍵,通過語音或識屏的方式更高效地完成很多日常生活中的高頻操作。
NEX 的 Jovi 體現(xiàn)了 vivo 這家樂于和用戶溝通的手機廠商在產(chǎn)品研發(fā)時對用戶的「關懷」,而對于現(xiàn)在的手機 AI 來說,這種實用派 AI 可能也是目前最合適的落腳點了。
-
AI
+關注
關注
87文章
29806瀏覽量
268107 -
vivo
+關注
關注
12文章
3291瀏覽量
63065 -
語音助手
+關注
關注
7文章
235瀏覽量
26785
發(fā)布評論請先 登錄
相關推薦
評論