0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI Agent:大模型的下一個(gè)高地

科技云報(bào)到 ? 來源:jf_60444065 ? 作者:jf_60444065 ? 2024-01-15 12:36 ? 次閱讀

科技云報(bào)道原創(chuàng)

當(dāng)所有人都沉浸在與ChatGPT對話的樂趣中,一場靜水流深的變革已然啟動(dòng)。

2023年11月,比爾·蓋茨發(fā)表了一篇文章,他表示,AI Agent將是大模型之后的下一個(gè)平臺,不僅改變每個(gè)人與計(jì)算機(jī)互動(dòng)的方式,還將在五年內(nèi)徹底改變我們的生活。

如果說大模型是未來水電煤一般的基礎(chǔ)設(shè)施,那么Agent則是未來用戶接觸、使用AI的方式。

AI Agent不再滿足于僅僅作為“聊天對象”的角色,而是渴望成為能在真實(shí)世界里揮灑自如的“智能執(zhí)行者”。

數(shù)據(jù)顯示,過去兩年間,針對AI Agent的研究投入增長幅度高達(dá)300%。大模型市場的玩家們,似乎正齊刷刷地轉(zhuǎn)向AI Agent。

在國內(nèi),截止去年11月中旬,AI Agent賽道發(fā)生融資事件13起,總?cè)谫Y金額約735億人民幣,公司融資均值為56.54億人民幣。

在國外,據(jù)外媒MattSchlicht數(shù)據(jù)顯示,至少有100個(gè)項(xiàng)目正致力于將AI代理商業(yè)化,近10萬名開發(fā)人員正在構(gòu)建自主Agent。

毫無疑問,AI Agent正在成為大模型之后下一個(gè)爆發(fā)點(diǎn)。

值得探討的是,作為一種巨大的技術(shù)變革,AI Agent將如何改變我們的生活?國內(nèi)外AI Agent的發(fā)展現(xiàn)狀如何?AI Agent落地的關(guān)鍵點(diǎn)是什么?

AI Agent:自主執(zhí)行任務(wù)的“小助手”

去年4月份,斯坦福和谷歌的研究者共同創(chuàng)建了一個(gè)“西部世界小鎮(zhèn)(Westworldsimulation)”。在這個(gè)小鎮(zhèn)里,25個(gè)AI Agent每天都在樂此不疲地散步、約會(huì)、聊天、用餐以及分享當(dāng)天的新聞。

wKgZomWktmKAYBliAAHJ6QnVXCo669.jpg

在這個(gè)實(shí)驗(yàn)中,AI Agent(智能體)在執(zhí)行任務(wù)和互動(dòng)上表現(xiàn)出了令人驚艷的自主性和智能性,由此引發(fā)了業(yè)界的高度關(guān)注。

事實(shí)上,這并不是AI Agent第一次出圈,其概念從出現(xiàn)到爆發(fā),已經(jīng)邁過多個(gè)階段。

在單一Agent階段,主要是針對不同領(lǐng)域和場景的特定任務(wù),開發(fā)和部署專門的智能體。以GPTengineer為例,給它一個(gè)需求,其就可以把代碼寫個(gè)大概。

在多Agent合作階段,是由不同角色的Agent自動(dòng)合作完成復(fù)雜的任務(wù)。

例如在MetaGPT上,如果讓其做一個(gè)股票分析的工具,它會(huì)把這個(gè)任務(wù)分別翻譯給產(chǎn)品經(jīng)理、架構(gòu)師、項(xiàng)目經(jīng)理等5個(gè)角色,模擬整個(gè)的軟件開發(fā)中所有決策工作流。

不過,隨著微軟全新工具AutoGen的發(fā)布,AI Agent很快翻開了新的篇章。

AutoGen允許多個(gè)LLM智能體通過聊天來解決任務(wù)。LLM智能體可以扮演各種角色,如程序員、設(shè)計(jì)師,或者是各種角色的組合,對話過程就把任務(wù)解決了。

與MetaGPT不同的是,MetaGPT的角色模型是被定義好的,而AutoGen可以讓開發(fā)者自己定義Agent,還可以讓他們相互對話。

這是一個(gè)新的且富有創(chuàng)造性的Agent框架。在AutoGen發(fā)布的兩個(gè)星期內(nèi),星標(biāo)量從390狂增到10K,并在Discord上吸引了5000多名成員。

如果說AutoGPT拉開了自主智能體(Autonomous Agent)的帷幕,那么前文提到的“西部世界小鎮(zhèn)”則開啟了生成智能體(Generative Agent)之路。

生成智能體就像美劇《西部世界》中的人形機(jī)器人或《失控玩家》中的智能NPC,它們在同一環(huán)境中生活,擁有自己的記憶和目標(biāo),不僅與人類交往,還會(huì)與其他機(jī)器人互動(dòng)。

總的來說,AI Agent是一個(gè)能夠自主行動(dòng)、執(zhí)行任務(wù)的“小助手”,能夠針對目標(biāo)獨(dú)立思考并做出行動(dòng),會(huì)根據(jù)給定任務(wù)詳細(xì)拆解出每一步的計(jì)劃步驟,依靠來自外界的反饋和自主思考,為自己創(chuàng)建prompt以實(shí)現(xiàn)目標(biāo)。

比如,讓AI Agent買一杯咖啡,它會(huì)首先拆解如何才能為你購買一杯咖啡并擬定代用某APP下單以及支付等若干步驟,然后按照這些步驟調(diào)用APP選擇外賣,再調(diào)用支付程序下單支付,過程無需人類去指定每一步操作。

而目前基于LLM的ChatGPT給出的反饋,只能止于“無法購買咖啡,它只是一個(gè)文字AI助手”之類的回答。

這也就不難理解,為什么AI Agent會(huì)是大模型的下一個(gè)高地——大模型聚焦于處理語言相關(guān)的任務(wù),它并不直接與現(xiàn)實(shí)世界互動(dòng),而AI Agent強(qiáng)調(diào)解決實(shí)際問題的能力和與環(huán)境交互的全面性。

AI Agent加速落地

事實(shí)上,大模型還沒有出現(xiàn)之前,一些企業(yè)就已在研究傳統(tǒng)AI與Agent的結(jié)合應(yīng)用。因此,AI Agent在各領(lǐng)域的落地比大家預(yù)想得要快很多。

目前,海外已經(jīng)在零售、房地產(chǎn)、旅游、客戶服務(wù)、人力資源、金融、制造業(yè)等多個(gè)領(lǐng)域出現(xiàn)AI Agent架構(gòu)與產(chǎn)品,例如:

在醫(yī)療領(lǐng)域,Agent可以幫助診斷、治療和監(jiān)測患者。IBM Watson Health 是一個(gè)AI智能體,可以分析醫(yī)療數(shù)據(jù),以識別潛在的健康問題并推薦治療方案。

在金融領(lǐng)域,Agent可以分析財(cái)務(wù)數(shù)據(jù)、檢測欺詐行為并提出投資建議。嘉信理財(cái)(Charles Schwab)使用名為Intelligent Portfolio的人工智能智能體,根據(jù)客戶的投資目標(biāo)創(chuàng)建和管理投資組合。

在零售業(yè)務(wù)場景中,Agent可以提供個(gè)性化推薦,改善供應(yīng)鏈管理,增強(qiáng)客戶體驗(yàn)。亞馬遜的Alexa是一個(gè)AI智能體,可以推薦產(chǎn)品、下訂單和跟蹤發(fā)貨。

在制造業(yè),Agent可以優(yōu)化生產(chǎn)流程,預(yù)測維護(hù)需求,提高產(chǎn)品質(zhì)量。通用電氣使用名為Predix的AI智能體實(shí)時(shí)監(jiān)控機(jī)器,以預(yù)測和防止設(shè)備故障。

在運(yùn)輸領(lǐng)域,自主AI Agent可以協(xié)助路線規(guī)劃、交通管理和車輛安全。特斯拉的Autopilot有助于自動(dòng)駕駛車輛,并幫助駕駛員停車、變道和安全駕駛。

不僅如此,在底層技術(shù)方面,AI Agent也打下了不錯(cuò)的基礎(chǔ)。

例如,OpenAI開發(fā)的GPTs,以及推出的GPT-4Turbo和可定制AI Agent,提供了基礎(chǔ)Agent的構(gòu)建能力,如工具調(diào)用、基于知識庫文件記憶能力等,使得AI Agent進(jìn)入了另外一個(gè)新階段,即人人都可以打造自己的Agent。

但總的來說,AI Agent技術(shù)還處于比較早期的階段,主要在兩個(gè)類型的場景中更容易落地:

一類是具有交互性質(zhì)的場景。

例如,智能機(jī)器人和問答式交互,這與AI Agent的迭代性質(zhì)天生匹配。在這種情境下,對于一些簡單的任務(wù),比如購買火車票或解決企業(yè)內(nèi)部IT服務(wù)的問題,任務(wù)型機(jī)器人的應(yīng)用效果較好,并且相對容易維護(hù)。

另一類是線性執(zhí)行任務(wù)的場景。

例如,一家支付公司要求用戶在開戶時(shí)提交身份證明,在這種場景下,前臺是單向的,但后臺可以利用AI Agent執(zhí)行,相較于原有的流水線,AI Agnet更為高效。

AI Agent落地挑戰(zhàn)

盡量理想很美好,但當(dāng)前市場上的大多數(shù)AI Agent,其實(shí)只是構(gòu)建了一個(gè)基于特定知識庫或?qū)I(yè)數(shù)據(jù)的Chatbot。這些智能體主要用于進(jìn)行問答交互,如獲取行業(yè)資訊、報(bào)告等,在程序聯(lián)動(dòng)和操作方面還有很大的提升空間。

在一些更復(fù)雜的場景中,現(xiàn)有的AI Agent技術(shù)只能做到輔助,無法完全實(shí)現(xiàn)自動(dòng)執(zhí)行。

這背后的原因有很多,包括技術(shù)能力、商業(yè)化路徑、應(yīng)用場景等,都會(huì)影響Agent的能力體現(xiàn)。

首當(dāng)其沖的,依然是技術(shù)問題。

LLM作為AI Agent的認(rèn)知核心,其智能性在很大程度上決定了AI Agent感知環(huán)境、做出決策并執(zhí)行適當(dāng)行動(dòng)的能力。但就目前而言,包括GPT-4在內(nèi)的所有大模型,能力仍需提升。

同時(shí),AI Agent繼承了LLM的一些問題,比如“幻覺”、“可解釋性”等問題。此外,對于底層基礎(chǔ)模塊的質(zhì)量和性能,包括調(diào)用圖像識別等模型,也會(huì)直接影響到上層建筑的性能。

此外,Agnet各個(gè)模塊之間的交互和運(yùn)行可能會(huì)產(chǎn)生許多中間結(jié)果和狀態(tài),這也帶來了一些技術(shù)挑戰(zhàn)。例如,處理中間結(jié)果的魯棒性是一個(gè)問題,下層模塊的性能和質(zhì)量會(huì)直接影響上層模塊的執(zhí)行。

其次,AI Agent的落地效果也受限于應(yīng)用場景。

例如,在出行預(yù)訂中,得益于豐富的API等問題,AI Agent表現(xiàn)出色。而在如法律助手場景中,由于新知識的頻繁出現(xiàn)和API的不完善,實(shí)際應(yīng)用面臨更多挑戰(zhàn)。

這一點(diǎn),從國內(nèi)AI Agent紛紛生長于協(xié)同辦公平臺就可見一斑。

由于協(xié)同辦公平臺本身具備良好的API接口和插件體系,這使得將大模型集成到現(xiàn)有工具中變得更加容易。

同時(shí),許多企業(yè)都在使用協(xié)同辦公軟件,這意味著廣泛的用戶基礎(chǔ)可以加速大模型的迭代和優(yōu)化過程,使其更好地滿足用戶需求。

最后,找到切入點(diǎn)以及好的商業(yè)模式至關(guān)重要。

AI Agent爆發(fā)的一段時(shí)間,人們普遍認(rèn)為補(bǔ)齊了大模型短板的AI Agent更具備實(shí)用性,將是大模型重要落地方向。

但就目前而言,這一路徑的商業(yè)化存在諸多問題。拿游戲場景而言,目前收費(fèi)主要來源于出售游戲裝備、皮膚等方式,而AI Agent的價(jià)值無法體現(xiàn)在這些固有的變現(xiàn)途徑上。

由于AI Agent落地效果未出現(xiàn)顛覆性的能力,C端用戶是否會(huì)為其買單無法得知,能否成為AI大模型從C端商業(yè)化爆發(fā)一個(gè)最核心應(yīng)用方向,還需時(shí)間驗(yàn)證。

相對來說,B端可能更適合AI Agent的落地。在Agent構(gòu)建平臺上,企業(yè)或?qū)⒖梢宰约簶?gòu)建自己RPA、CRM、辦公OA等一系列管理軟件;軟件廠商也可以基于此平臺構(gòu)建軟件為企業(yè)提供服務(wù)。

但這仍需要成本控制、投入預(yù)算、實(shí)現(xiàn)效率、安全管控等多方面嚴(yán)格及縝密的評估。

結(jié)語

無論存在多少質(zhì)疑,時(shí)至今日,AI Agent依然帶來了諸多想象力。技術(shù)發(fā)展之路本就充滿質(zhì)疑與批判,科技變革對于任何一個(gè)企業(yè)與個(gè)體都是一場機(jī)遇,關(guān)鍵在于如何把握它。

【關(guān)于科技云報(bào)道】

專注于原創(chuàng)的企業(yè)級內(nèi)容行家——科技云報(bào)道。成立于2015年,是前沿企業(yè)級IT領(lǐng)域Top10媒體。獲工信部權(quán)威認(rèn)可,可信云、全球云計(jì)算大會(huì)官方指定傳播媒體之一。深入原創(chuàng)報(bào)道云計(jì)算、大數(shù)據(jù)、人工智能、區(qū)塊鏈等領(lǐng)域。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28876

    瀏覽量

    266218
  • ChatGPT
    +關(guān)注

    關(guān)注

    28

    文章

    1517

    瀏覽量

    6925
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2135

    瀏覽量

    1978
收藏 人收藏

    評論

    相關(guān)推薦

    基于Qwen-Agent與OpenVINO構(gòu)建本地AI智能體

    Qwen2 是阿里巴巴集團(tuán) Qwen 團(tuán)隊(duì)研發(fā)的大語言模型和大型多模態(tài)模型系列。Qwen2 具備自然語言理解、文本生成、視覺理解、音頻理解、工具使用、角色扮演、作為 AI Agent
    的頭像 發(fā)表于 07-26 09:54 ?584次閱讀
    基于Qwen-<b class='flag-5'>Agent</b>與OpenVINO構(gòu)建本地<b class='flag-5'>AI</b>智能體

    AI造夢師,大模型正在孵化下一個(gè)黃金職業(yè)

    AI電影造夢師這個(gè)領(lǐng)域,切都將是新的
    的頭像 發(fā)表于 05-28 09:20 ?1595次閱讀
    <b class='flag-5'>AI</b>造夢師,大<b class='flag-5'>模型</b>正在孵化<b class='flag-5'>下一個(gè)</b>黃金職業(yè)

    華為正接洽收購高合汽車 目標(biāo)“打造下一個(gè)賽力斯”?

    據(jù)中工汽車網(wǎng)獲悉,2月27日,在片唱衰高合汽車的輿論浪潮下,網(wǎng)絡(luò)上又出現(xiàn)了華為正接洽收購高合汽車,并且目標(biāo)“打造下一個(gè)賽力斯”的消息。
    的頭像 發(fā)表于 02-28 14:14 ?757次閱讀
    華為正接洽收購高合汽車 目標(biāo)“打造<b class='flag-5'>下一個(gè)</b>賽力斯”?

    谷歌DeepMind資深AI研究員創(chuàng)辦AI Agent創(chuàng)企

    近日,剛從谷歌DeepMind離職的資深AI研究員Ioannis Antonoglou宣布創(chuàng)辦了家名為“AI Agent”的創(chuàng)企。Ioannis Antonoglou常駐倫敦,此前曾
    的頭像 發(fā)表于 02-04 10:02 ?632次閱讀

    AI Agent爆發(fā)在即!深剖AI Agent技術(shù)原理及發(fā)展趨勢

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)AI Agent指人工智能代理,是種能夠感知環(huán)境、進(jìn)行決策和執(zhí)行動(dòng)作的智能實(shí)體。AI Agent通常基于機(jī)器
    的頭像 發(fā)表于 01-12 01:01 ?3425次閱讀

    AI模型可以設(shè)計(jì)電路嗎?

    AI模型
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2024年01月02日 15:09:29

    AGI時(shí)代的奠基石:Agent+算力+大模型是構(gòu)建AI未來的三駕馬車嗎?

    AI Agent的訓(xùn)練離不開算力,服務(wù)器作為個(gè)強(qiáng)大的計(jì)算中心,為AI Agent提供算力基礎(chǔ),
    的頭像 發(fā)表于 12-21 13:34 ?1054次閱讀
    AGI時(shí)代的奠基石:<b class='flag-5'>Agent</b>+算力+大<b class='flag-5'>模型</b>是構(gòu)建<b class='flag-5'>AI</b>未來的三駕馬車嗎?

    從數(shù)據(jù)到生成式AI,是該重新思考風(fēng)險(xiǎn)的時(shí)候了

    AI模型下一個(gè) 安全新戰(zhàn)場
    的頭像 發(fā)表于 12-11 14:36 ?220次閱讀

    解析AI Agent的發(fā)展現(xiàn)狀和技術(shù)難點(diǎn)

    AI Agent 這項(xiàng)技術(shù)可以說是建立在大語言模型之上的種全新技術(shù)。我們擁有了大語言模型之后,大家發(fā)現(xiàn)除了微調(diào)之外,還可以進(jìn)行所謂的上下文
    的頭像 發(fā)表于 12-05 15:33 ?1047次閱讀

    淺談Q-Learning在Agent的應(yīng)用

    經(jīng)典的文字模型我們已經(jīng)很熟悉了:訓(xùn)練時(shí),模型不停的預(yù)測下一個(gè) token 并與真實(shí)語料比較,直到模型的輸出分布非常接近于真實(shí)分布。
    的頭像 發(fā)表于 12-02 16:53 ?782次閱讀
    淺談Q-Learning在<b class='flag-5'>Agent</b>的應(yīng)用

    晶體管的下一個(gè)25年

    晶體管的下一個(gè)25年
    的頭像 發(fā)表于 11-27 17:08 ?516次閱讀
    晶體管的<b class='flag-5'>下一個(gè)</b>25年

    AI 模型構(gòu)建的五個(gè)過程詳解

    AI 模型構(gòu)建的過程 模型構(gòu)建主要包括 5 個(gè)階段,分別為模型設(shè)計(jì)、特征工程、模型訓(xùn)練、
    發(fā)表于 11-17 10:31 ?7298次閱讀
    <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>構(gòu)建的五<b class='flag-5'>個(gè)</b>過程詳解

    我們心中AI Agent的現(xiàn)在和未來

    在大模型技術(shù)上領(lǐng)先的 OpenAI 同樣對 AI Agent 十分感興趣,它們的首席科學(xué)家 Ilya Sutskever 不止次表達(dá)過 OpenAI 對
    的頭像 發(fā)表于 11-09 16:20 ?595次閱讀

    USB連接MCU的:哪個(gè)更適合你的下一個(gè)設(shè)計(jì)?

    下一個(gè)設(shè)計(jì)的實(shí)現(xiàn)驚訝。本文將介紹些差異化的USB功能,你會(huì)發(fā)現(xiàn),在流行的MCU系列。旦你了解些關(guān)鍵的不同,你可以更好地尋找,將提供完美的適合你的
    的頭像 發(fā)表于 11-03 16:17 ?679次閱讀

    下一個(gè)十年誰會(huì)是智能手機(jī)戰(zhàn)場上的核芯

    電子發(fā)燒友網(wǎng)站提供《下一個(gè)十年誰會(huì)是智能手機(jī)戰(zhàn)場上的核芯.doc》資料免費(fèi)下載
    發(fā)表于 11-03 10:35 ?0次下載
    <b class='flag-5'>下一個(gè)</b>十年誰會(huì)是智能手機(jī)戰(zhàn)場上的核芯