0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

阿里發(fā)布手機操作智能體框架Mobile-Agent

CHANBAEK ? 來源:網(wǎng)絡(luò)整理 ? 2024-02-05 10:41 ? 次閱讀

阿里巴巴與北京交通大學的聯(lián)合團隊近日在學術(shù)界引起了廣泛關(guān)注,因為他們共同推出了一款全新的手機操作智能體框架——Mobile-Agent。這款框架旨在為手機用戶提供更高效、便捷的操作體驗,引領(lǐng)手機操作方式的全新革命。

Mobile-Agent框架的核心優(yōu)勢在于其純視覺解決方案。傳統(tǒng)的手機操作方式往往需要依賴XML等標記語言以及系統(tǒng)元數(shù)據(jù),而Mobile-Agent則完全摒棄了這些需求。這意味著用戶無需進行復(fù)雜的設(shè)置或修改,只需通過直觀的視覺指示即可完成操作。

Mobile-Agent的操作范圍不受任何限制,可以在任何應(yīng)用上進行操作。這得益于其強大的多應(yīng)用操作能力,使得用戶可以在不同應(yīng)用之間輕松切換,無需重復(fù)相同的操作步驟。

為了實現(xiàn)精確的操作定位,Mobile-Agent配備了多種視覺感知工具。這些工具能夠識別屏幕上的各種元素,如按鈕、圖標等,并對其進行精準的定位和識別。這一功能為用戶提供了更加個性化的操作體驗,滿足各種不同用戶的需求。

最令人驚喜的是,Mobile-Agent無需進行任何訓練即可即插即用。這意味著用戶無需花費大量時間進行學習和適應(yīng),即可輕松上手。這種便捷性使得Mobile-Agent具有廣泛的應(yīng)用前景,為各類用戶提供更加高效、智能的手機操作體驗。

目前,Mobile-Agent已經(jīng)學會了如何操作阿里巴巴、谷歌地圖、TikTok等10個知名應(yīng)用。這意味著用戶可以通過簡單的視覺指示,在這些應(yīng)用上進行各種操作,完成跨應(yīng)用任務(wù)。這一功能為用戶提供了前所未有的便利性,使得手機操作變得更加輕松愉快。

總體來說,阿里發(fā)布的手機操作智能體框架Mobile-Agent具有巨大的潛力,有望引領(lǐng)手機操作方式的全新變革。通過純視覺解決方案、不受限制的操作范圍、精準的操作定位以及無需訓練的便捷性,Mobile-Agent為用戶提供了更加高效、智能的手機操作體驗。未來,我們期待看到更多關(guān)于Mobile-Agent的研究和應(yīng)用,為手機操作領(lǐng)域帶來更多的創(chuàng)新和突破。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 手機
    +關(guān)注

    關(guān)注

    34

    文章

    6792

    瀏覽量

    156679
  • 阿里巴巴
    +關(guān)注

    關(guān)注

    7

    文章

    1603

    瀏覽量

    46774
收藏 人收藏

    評論

    相關(guān)推薦

    基于Qwen-Agent與OpenVINO構(gòu)建本地AI智能

    Qwen2 是阿里巴巴集團 Qwen 團隊研發(fā)的大語言模型和大型多模態(tài)模型系列。Qwen2 具備自然語言理解、文本生成、視覺理解、音頻理解、工具使用、角色扮演、作為 AI Agent 進行互動等多種能力。
    的頭像 發(fā)表于 07-26 09:54 ?584次閱讀
    基于Qwen-<b class='flag-5'>Agent</b>與OpenVINO構(gòu)建本地AI<b class='flag-5'>智能</b><b class='flag-5'>體</b>

    螞蟻集團發(fā)布首個開源金融場景多智能框架

    在第七屆數(shù)字中國建設(shè)峰會上,螞蟻集團宣布了一項引人注目的舉措:正式開源其多智能框架agentUniverse。這一框架不僅是金融領(lǐng)域的首個開源多
    的頭像 發(fā)表于 05-28 09:25 ?555次閱讀

    阿里達摩院提出“知識鏈”框架,降低大模型幻覺

    近日,阿里巴巴達摩院(湖畔實驗室)攜手新加坡南洋理工大學等研究機構(gòu),共同推出了大模型知識鏈(CoK)框架。該框架不僅可實時檢索異構(gòu)知識源,還能逐步糾正推理錯誤,有效提高了大模型在回答知識型問題時的準確率,并顯著降低了所謂的“幻覺
    的頭像 發(fā)表于 05-10 11:46 ?560次閱讀

    阿里發(fā)布通義千問2.5

    阿里云近日正式發(fā)布了通義千問2.5,標志著其人工智能技術(shù)在中文語境下取得了重要突破。據(jù)阿里智能集團首席技術(shù)官周靖人介紹,通義千問2.5在文
    的頭像 發(fā)表于 05-10 09:57 ?403次閱讀

    創(chuàng)作者變身知識智能,AI時代的“超級個體”

    Agent不創(chuàng)作:為什么知識智能是創(chuàng)作者的人生杠桿?
    的頭像 發(fā)表于 04-23 09:26 ?1192次閱讀
    創(chuàng)作者變身知識<b class='flag-5'>智能</b><b class='flag-5'>體</b>,AI時代的“超級個體”

    谷歌DeepMind推出SIMI通用AI智能

    近日,谷歌的DeepMind團隊發(fā)布了其最新研究成果——SIMI(Scalable Instructable Multiworld Agent),這是一個通用人工智能智能
    的頭像 發(fā)表于 03-18 11:39 ?751次閱讀

    OPPO發(fā)布1+N 智能生態(tài)戰(zhàn)略,聯(lián)發(fā)科攜手OPPO打造AI手機生態(tài)

    最近,OPPO舉辦AI戰(zhàn)略發(fā)布會,發(fā)布由 OPPO AI 超級智能和 AI Pro 智能開發(fā)
    的頭像 發(fā)表于 02-21 17:03 ?842次閱讀
    OPPO<b class='flag-5'>發(fā)布</b>1+N <b class='flag-5'>智能</b><b class='flag-5'>體</b>生態(tài)戰(zhàn)略,聯(lián)發(fā)科攜手OPPO打造AI<b class='flag-5'>手機</b>生態(tài)

    OPPO發(fā)布1+N智能生態(tài)戰(zhàn)略

    OPPO近日在全球科技界掀起了波瀾,正式發(fā)布了其獨特的1+N智能生態(tài)戰(zhàn)略,標志著這家科技巨頭在人工智能領(lǐng)域的全新布局。該戰(zhàn)略的核心在于兩大組件:AI超級
    的頭像 發(fā)表于 02-21 10:36 ?578次閱讀

    微軟推出首個專為Windows定制的Agent

    隨著人工智能技術(shù)的飛速發(fā)展,全球科技巨頭紛紛在這一領(lǐng)域布局。OpenAI以其強大的技術(shù)實力在視頻領(lǐng)域掀起了一場革命,而微軟則悄然對傳統(tǒng)用戶界面發(fā)起了挑戰(zhàn)。近日,微軟最新發(fā)布了一款名為UFO(UI-Focused Agent)的
    的頭像 發(fā)表于 02-19 11:41 ?706次閱讀

    微軟發(fā)布Agent框架UFO,引領(lǐng)UI交互新紀元

    微軟近日宣布推出全新的Agent框架——UFO(UI-Focused Agent),旨在構(gòu)建更智能、更直觀的用戶界面交互體驗。該框架基于Op
    的頭像 發(fā)表于 02-19 11:15 ?953次閱讀

    AI Agent爆發(fā)在即!深剖AI Agent技術(shù)原理及發(fā)展趨勢

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)AI Agent指人工智能代理,是一種能夠感知環(huán)境、進行決策和執(zhí)行動作的智能實體。AI Agent通常基于機器學習和人工
    的頭像 發(fā)表于 01-12 01:01 ?3426次閱讀

    人工智能安全一化治理的基本框架

    本報告是房超教授在2023年10月14-15日由中國人工智能學會(CAAI)主辦、CAAI人工智能倫理與治理工委會承辦的“首屆人工智能倫理與治理大會”上進行的邀請報告《人工智能安全一
    發(fā)表于 11-14 10:46 ?307次閱讀
    人工<b class='flag-5'>智能</b>安全一<b class='flag-5'>體</b>化治理的基本<b class='flag-5'>框架</b>

    Esp8266接入什么平臺支持阿里智能方糖控制?

    Esp8266接入什么平臺支持阿里智能方糖控制
    發(fā)表于 11-09 06:41

    基于Agent智能控制系統(tǒng)的設(shè)計

    電子發(fā)燒友網(wǎng)站提供《基于Agent智能控制系統(tǒng)的設(shè)計.pdf》資料免費下載
    發(fā)表于 10-18 10:57 ?0次下載
    基于<b class='flag-5'>Agent</b>的<b class='flag-5'>智能</b>控制系統(tǒng)的設(shè)計

    Java Agent的作用及原理

    Java Agent是目前各種監(jiān)測調(diào)試JVM的主要技術(shù)。Eclipse,IntelliJ,Visual VM ,JConsole 等都依賴于此技術(shù)。相信你們的Java 程序部署的時候肯定也會配置各種
    的頭像 發(fā)表于 10-10 15:53 ?1465次閱讀
    Java <b class='flag-5'>Agent</b>的作用及原理