0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從方言對話這枚“落子”,看AI手機“棋局”的尷尬賽點

腦極體 ? 來源: 腦極體 ? 作者: 腦極體 ? 2024-11-01 09:21 ? 次閱讀
wKgZomcjjr6AagLxAAnjENBQWHs894.jpg

這段時間,手機廠商的新品發(fā)布會、開發(fā)者活動比較密集,我們團隊東奔西跑,整體感覺是,手機AI確實火了,但這盤棋局,所有廠商都對弈得不太輕松。

一方面,各家都在想盡辦法講好AI故事。一位CEO在發(fā)布會后采訪時就特別煩惱,“AI要講場景,不講場景用戶沒感覺,明年我們還要上很多新功能,發(fā)布會的兩個小時根本講不完”。這是手機AI越來越完善的一面。

但同時我們也發(fā)現(xiàn),大家手里的牌其實都差不多,很少有哪家能靠一個或某個AI功能,就形成碾壓級的體驗優(yōu)勢。結(jié)果就是單點功能容易被復(fù)制,AI手機功能趨同。我就聽過至少三個廠商表示:我們這個xx功能去年一推出就被致敬了,歡迎友商來“普及”我們這個AI功能……

假設(shè)AI手機市場是圍棋對弈,觀眾們想看什么樣的比賽過程?肯定是棋手們通過各種復(fù)雜的策略,展開激烈的劫爭,才能吸引大家的注意力。而不是各方實力差不多,導(dǎo)致比賽過程冗長乏味、難分勝負。目前的AI手機競爭,就有點后者的意思。

在大眾對AI手機這一概念的興奮勁兒過去之前,手機廠商們必須盡快找到更聚焦的策略和體系化攻勢,而不能只關(guān)注淺層的、零敲碎打的AI功能。

舉個例子,方言對話,就不是AI手機的一步好棋。

wKgZomcjjr6AWyFcAAJSJrZPJFc873.jpg

首先要說明的是,方言的識別、理解與生成、交互是非常重要,甚至不容有失的一個領(lǐng)域。

從技術(shù)能力上看,方言的語言資料少,語音識別、語義理解、語音合成等模型的打磨,也比普通話等主流語種要更復(fù)雜、成本更高,是比較能體現(xiàn)科技公司實力的。

從社會效益上看,國內(nèi)還有20%群體沒有完成普通話的普及,確實有很多人存在方言對話的需求。而且,隨著大模型的到來,低資源的方言如果不能被大語言模型所學習和訓(xùn)練,很可能越來越弱勢,甚至消失。所以,從科技普惠、文化保護的角度,方言對話也是十分必要的。

今年的幾個手機廠商活動中,我們就看到了方言對話成為手機AI的一個典型用例。其中應(yīng)用場景包括:

1.方言的語音理解。普通話不標準的用戶發(fā)出的方言指令,也能被手機智能助手很好地理解。

2.方言的語音生成。手機智能助手可以用本地方言跟用戶聊天,播報新聞等,提供更個性化、更溫暖的服務(wù)。

上述功能當然是有用的,但從市場策略上來說,方言對話真的是手機廠商在AI領(lǐng)域的一步好棋嗎?未必。

wKgZomcjjr-AeAa3AAIZFSSFEBA470.jpg

之所以說方言對話不是一步好棋,答案在于,市場策略的低效性。

無論是短期或長期,手機廠商想靠方言對話來帶動AI手機市場,都是一件挺困難的事情。

短期看,市場營銷最看重的就是“效果”,即激發(fā)消費者的行動,這就要進行好的CTA(Call To Action,行動呼吁)設(shè)計。

比如傳統(tǒng)電視廣告會呼吁“趕快拿起電話訂購吧”,網(wǎng)頁時代會將“click”“立即咨詢”等按鈕放在最顯眼的地方,而近期手機廠商也意識到AI很難被用戶感知,開始營造場景化、現(xiàn)場感的氛圍,來讓觀眾們身臨其境。

那么,方言對話的用例展示,能夠讓用戶做出關(guān)注、搜索、試用、購買等商業(yè)想要的行為嗎?顯然是很低效的。

“AI手機”的受眾大多是對前沿技術(shù)、新銳功能比較感興趣的年輕群體、極客、潮人等,普通話普及率是比較高的,方言對話固然有趣、有人情味兒,但并不會高頻使用,所以轉(zhuǎn)化到購買行為的概率很低。

當然,也許有人會說,方言對話很能彰顯手機廠商的技術(shù)實力和人文關(guān)懷啊,這對品牌來說是一種長期利好,沒錯,但前提是手機廠商能在方言領(lǐng)域建立長期壁壘,而這幾乎不可能。

一是成本很高。語音識別、理解依賴于大規(guī)模語料數(shù)據(jù),而方言數(shù)據(jù)的采集和標注成本比普通話更高。有業(yè)內(nèi)人士分享,傳統(tǒng)單一方言的識別,需要十萬小時的標注數(shù)據(jù)量才能獲得比較好的效果。這意味著,手機廠商要投入極高的研發(fā)成本,去開發(fā)一個市場前景未知的小眾功能。

二是技術(shù)挑戰(zhàn)。即使有的手機廠商愿意在方言領(lǐng)域的耐心投入,但能否建立壁壘也要打一個問號。

wKgZomcjjsCAR3x_AAIG-h1DZr4308.jpg

目前,基礎(chǔ)模型廠商如科大訊飛(星火大模型V4.0)、商湯科技(商量SenseChat粵語版大模型)、阿里通義實驗室(粵語識別與生成大模型),基礎(chǔ)服務(wù)商如中國電信(星辰大模型)、字節(jié)跳動(豆包大模型)、喜馬拉雅(珠峰AI音頻多模態(tài)大模型)等,都推出了自研的、具備方言能力的語音大模型,手機廠商想要在這一技術(shù)賽道上做到“人有我優(yōu)”并不容易。友商通過基于開源模型自研或與閉源模型合作等形式,就能補齊相關(guān)能力。

wKgaomcjjsCAfqnFAAEW92OF1RA779.jpg

所以,想要靠方言能力建立壁壘,長期為品牌價值賦能,很難做到,投資效益比也要打一個問號。

總結(jié)一下,從短期市場行動到長期品牌價值上,方言對話帶來的貢獻都很有限,算是一個低效落子。

其實,類似方言對話這樣零敲碎打的AI功能還有不少。這暴露了AI手機目前的一個尷尬處境,就是趨勢向好、細節(jié)模糊。AI應(yīng)用到底怎么做?這是很多廠商還沒有想好的問題。

wKgZomcjjsGAOkIeAAJiE87jc8M174.jpg

越來越多的AI功能加入手機,卻面對一種硬件新品的階段性困境:

需求模糊,必然有大量AI功能注定失敗。

AI大模型作為一種新技術(shù),用戶根本不知道怎么用,甚至手機廠商、產(chǎn)品經(jīng)理們自己也不知道。以“產(chǎn)品成熟時才發(fā)布”而著稱的蘋果,在這一輪AI浪潮中行動也是頭部廠商中最慢的。這種情況下,很多AI功能是廠家根據(jù)模糊的需求或自己的產(chǎn)品定義拿出的探索方案,其中必然會有很多是注定失敗或被遺忘的。

多點開花,難以產(chǎn)生壓倒性的說服力。

AI+手機相結(jié)合的場景眾多,手機廠商在探索中很容易多點開花,如果不成體系,就很難形成具有壓倒性說服力的產(chǎn)品。在消費理性化的市場環(huán)境下,結(jié)果就是無法激發(fā)用戶的購買欲望。一個AI功能,A廠商有,B廠商很快也能推出,既然“等等黨永遠不虧”,那就干脆持幣以待。

方言對話,就恰好是這樣一種很難拉開差距的AI功能。

整體來看,相比去年,手機中的AI應(yīng)用數(shù)量,有了極大增長,場景也越來越多,從簡單的文生文、文生圖能力展示,與輸入法、攝影、系統(tǒng)設(shè)置、出行服務(wù)、點餐等諸多場景都有了結(jié)合。AI作為撬動手機新一輪換機潮的關(guān)鍵,越來越受到了用戶、媒體與分析師的認可。

面對整體向好、細節(jié)模糊的“AI手機”大趨勢,手機廠商當下最需要的就是聚焦。用更清晰、體系化的產(chǎn)品策略來展開市場攻勢,一鼓作氣形成突破,快速完成對細分市場份額的占有。

比如給方言對話這一步散棋出個主意,用“讓父母大膽開口說”來撬動中青年群體為長輩換機,這就需要:

1.產(chǎn)品精細化,在語音大模型的基礎(chǔ)能力上,開發(fā)出中老年高頻用機場景下,具有說服力的方言產(chǎn)品,比如方言取消續(xù)費套餐,方言搜索影視劇內(nèi)容等。

2.能力體系化,除了方言對話,結(jié)合中老年用機需求,形成組合攻勢。比如AI反詐、手機自動駕駛主動服務(wù)、適老化功能等,全面解決目標群體的用機困擾。

3.營銷情境化,AI作為一種通用軟件技術(shù),大眾還是難以理解,通過場景化、故事化的營銷方式,更容易激發(fā)用戶的代入感,產(chǎn)生興趣和后續(xù)的行為。這就要求手機廠商改變與用戶溝通的方式,從比參數(shù)、放demo、碾壓友商、價格刺激等短平快式輸出,轉(zhuǎn)變?yōu)榍榫郴恼Z言。

通過方言對話這一個AI用例,我們會發(fā)現(xiàn)AI手機的棋局才剛剛開始。手機作為最適合AI落地的硬件載體,行業(yè)正逐步收斂與聚焦,接下來更清晰有力的體系化AI能力與策略會逐步登場。

從一個個AI功能的零敲碎打,到體系化AI能力的強勢出擊,屆時不同廠商也將拉開顯著差距。

高水平的激烈劫爭,是一場圍棋賽最精彩的部分,我們會繼續(xù)為大家解說大模型時代的手機賽事。

wKgaomcjjsKAGWcjAAGokTUd1v8968.jpg
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29707

    瀏覽量

    268019
  • ai手機
    +關(guān)注

    關(guān)注

    0

    文章

    43

    瀏覽量

    3218
收藏 人收藏

    評論

    相關(guān)推薦

    手機行業(yè)AI競賽步入新階段:顛覆到體驗提升

    自去年以來,手機行業(yè)掀起了一場生成式人工智能(AIGC)的競賽熱潮,各大廠商紛紛加大AI技術(shù)的研發(fā)力度。然而,經(jīng)過近一年的發(fā)展,AI手機已逐漸
    的頭像 發(fā)表于 10-23 11:36 ?268次閱讀

    人工智能ai4s試讀申請

    目前人工智能在繪畫對話等大模型領(lǐng)域應(yīng)用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個需要研究的課題,本書對ai4s基本原理和原則,方法進行描訴,有利于總結(jié)經(jīng)驗,擬
    發(fā)表于 09-09 15:36

    AI奧運 | 巴黎奧運會看人工智能的應(yīng)用和發(fā)展

    2024巴黎奧運會火熱空前,開幕式到金牌爭奪戰(zhàn),本屆奧運會的關(guān)注熱度持續(xù)攀升。與往屆不同的是,本屆奧運會不僅是首次在體育場館外舉辦的戶外開幕式的奧運會,同時也是在轉(zhuǎn)播技術(shù)上首次廣泛應(yīng)用AI技術(shù)
    的頭像 發(fā)表于 08-09 16:17 ?903次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>看</b>奧運 | <b class='flag-5'>從</b>巴黎奧運會看人工智能的應(yīng)用和發(fā)展

    【AIBOX快速入門】2步玩轉(zhuǎn)AI對話

    隨著目前AI的高速發(fā)展,大批量AI硬件應(yīng)運而生,但使用門檻普遍較高。為了解決這類問題,F(xiàn)irefly開源團隊推出了基于Web的AI對話應(yīng)用:FireflyChat,讓
    的頭像 發(fā)表于 05-30 08:02 ?489次閱讀
    【AIBOX快速入門】2步玩轉(zhuǎn)<b class='flag-5'>AI</b><b class='flag-5'>對話</b>

    中國電信發(fā)布首個支持30種方言混說語音大模型

    中國電信人工智能研究院(TeleAI)近日發(fā)布了一項引領(lǐng)業(yè)界的語音識別技術(shù)——星辰超多方言語音識別大模型。這一模型突破性地支持30種方言的自由混說識別,打破了傳統(tǒng)單一模型只能識別特定方言的局限。
    的頭像 發(fā)表于 05-28 09:14 ?527次閱讀

    Vidda兩個“進球”,拿下高端智能顯示終端的中場

    高端智能顯示終端“中場”,Vidda踢出兩個“進球”
    的頭像 發(fā)表于 05-17 14:11 ?387次閱讀
    Vidda兩個“<b class='flag-5'>賽</b><b class='flag-5'>點</b>進球”,拿下高端智能顯示終端的中場<b class='flag-5'>賽</b>

    開發(fā)者手機 AI - 目標識別 demo

    Lite的API接口實現(xiàn)主要功能; Mindspore Lite為Openharmony AI推理框架,為上層應(yīng)用提供統(tǒng)一的AI推理接口,可以完成在手機等端側(cè)設(shè)備中的模型推理過程; Neural
    發(fā)表于 04-11 16:14

    谷歌推出能制作旅行攻略的AI工具

    谷歌近日發(fā)布了一項令人矚目的新功能,它是一款能夠借助自然語言對話幫助用戶生成旅行行程和出游建議的AI工具。這款工具的推出,標志著谷歌在人工智能領(lǐng)域的又一重要突破。
    的頭像 發(fā)表于 03-29 11:08 ?594次閱讀

    百度地圖AI向?qū)в脩羝苾|,日均提供超千萬次對話

    百度地圖AI向?qū)в脩羝苾|,日均提供超千萬次對話
    的頭像 發(fā)表于 03-21 09:44 ?361次閱讀
    百度地圖<b class='flag-5'>AI</b>向?qū)в脩羝苾|,日均提供超千萬次<b class='flag-5'>對話</b>

    用于對話AI的高性能MEMS麥克風,助力改進用戶體驗

    對話式人工智能(AI)是一個快速發(fā)展的機器學習(ML)領(lǐng)域,旨在使人機交互更加自然直觀。
    的頭像 發(fā)表于 03-12 09:44 ?770次閱讀
    用于<b class='flag-5'>對話</b>式<b class='flag-5'>AI</b>的高性能MEMS麥克風,助力改進用戶體驗

    OpenAI 在 AI 生成視頻領(lǐng)域扔出一“王炸”,視頻生成模型“Sora”

    ABSTRACT摘要2月16日凌晨,也就是中國大年初七,OpenAI在AI生成視頻領(lǐng)域扔出一“王炸”,宣布推出全新的生成式人工智能模型“Sora”。這家舊金山公司周四推出的該工具使用生成
    的頭像 發(fā)表于 02-22 08:25 ?333次閱讀
    OpenAI 在 <b class='flag-5'>AI</b> 生成視頻領(lǐng)域扔出一<b class='flag-5'>枚</b>“王炸”,視頻生成模型“Sora”

    CES 2024AI PC江湖

    CES 2024有閉幕的一天,但這場名為AI的PC產(chǎn)業(yè)協(xié)奏,才初試啼聲
    的頭像 發(fā)表于 01-13 14:53 ?1854次閱讀
    <b class='flag-5'>從</b>CES 2024<b class='flag-5'>看</b><b class='flag-5'>AI</b> PC江湖

    設(shè)計車載激光雷達搞清5很重要!

    設(shè)計車載激光雷達搞清5很重要!
    的頭像 發(fā)表于 11-27 14:26 ?530次閱讀
    設(shè)計車載激光雷達搞清<b class='flag-5'>這</b>5<b class='flag-5'>點</b>很重要!

    方言離線語音控制場景解決方案

    情況下,留守老人和小孩說方言比較多,在雷龍離線語音模塊 自定義語音的幫助下,老人或小孩不再需要手動操作復(fù)雜的電子設(shè)備。他們只需對設(shè)備用方言說出自己的需求,即可實現(xiàn)設(shè)備的控制。這一功能對于老人和小孩來說
    發(fā)表于 11-17 17:57

    方言離線語音控制場景解決方案

    老人和小孩說方言比較多,在雷龍離線語音模塊自定義語音的幫助下,老人或小孩不再需要手動操作復(fù)雜的電子設(shè)備。他們只需對設(shè)備用方言說出自己的需求,即可實現(xiàn)設(shè)備的控制。
    的頭像 發(fā)表于 11-17 17:54 ?571次閱讀
    <b class='flag-5'>方言</b>離線語音控制場景解決方案