在线电影,在线播放国产不卡视频

近日，面壁智能聯(lián)合清華自然語言處理實驗室等機構(gòu)的研究人員共同發(fā)布了新一代流程自動化范式 Agentic Process Automation，該范式不僅實現(xiàn)了工作流構(gòu)建的自動化，更在工作流執(zhí)行時引入了動態(tài)決策的自動化。這一創(chuàng)新將為未來自動化領(lǐng)域帶來更高層次的效率和靈活性，將人類從繁重的勞動中解放出來。

在歷史的長河中，自動化是人類技術(shù)發(fā)展的主要動力，幫助人類從復雜、危險、繁瑣的勞動環(huán)境中解放出來。自早期農(nóng)業(yè)時代的水車灌溉，到工業(yè)時代的蒸汽機，人類一直在不斷尋求更加先進的自動化技術(shù)，從而解放自身于繁重的工作。

隨著信息時代的到來，軟件作為信息處理、存儲和通信的基礎(chǔ)成為了人類生產(chǎn)生活密不可分的一環(huán)，從而催成了機器人流程自動化（Robotic Process Automation, RPA）技術(shù)。其通過人工編制規(guī)則將多個軟件協(xié)調(diào)成一個固化的工作流（Workflow），通過模擬人交互的方式來和軟件交互實現(xiàn)高效執(zhí)行。

▲圖1. 機器人流程自動化 RPA 與智能體流程自動化 APA 對比

RPA 利用軟件機器人或稱為 “BOT” 來模擬和執(zhí)行重復性、規(guī)則性的任務，從而解放人力資源，提高工作效率。RPA 的應用范圍非常廣泛。很多企業(yè)（包括銀行、保險公司、制造業(yè)、零售業(yè)等各個行業(yè)）常利用 RPA 機器人來自動執(zhí)行一些常規(guī)和繁瑣的任務，例如：數(shù)據(jù)錄入、數(shù)據(jù)提取、數(shù)據(jù)處理。通過自動化任務，RPA 可以大幅度減少錯誤率，并且能夠在 24*7 不間斷地執(zhí)行任務，從而提高了業(yè)務的可靠性和響應能力。根據(jù)市場研究，RPA 市場正在迅速增長并取得巨大成功。Gartner 預測，2023 年全球 RPA 市場收入將達到 33 億美元，相比 2022 年增長 17.5%。這表明了企業(yè)對于 RPA 的強烈需求和認可。

但是，RPA 僅能替代簡單、機械的人力工作，一些復雜的流程仍舊依賴人工：

1. 編寫 RPA 工作流本身需要繁重的人類勞動，成本較高。

2. 復雜任務非常靈活，通常涉及動態(tài)決策，難以固化為規(guī)則進行表示。

▲圖2. RPA 與 APA 的效率與智能對比

幸運的是，最近 AI 領(lǐng)域興起的大模型智能體技術(shù)（Large Language Model based Agents, LLM-based Agents）也許給自動化技術(shù)創(chuàng)造了新的可能性。有沒有可能將 Agent 技術(shù)的靈活性引入到 RPA 領(lǐng)域中，來進一步減少人的參與呢？

該團隊的研究探討了大模型智能體時代下新型自動化范式 “智能體流程自動化” Agentic Process Automation (APA)。和傳統(tǒng) RPA 相比，在 APA 范式中，Agent 可以根據(jù)人類的需求自主完成工作流構(gòu)建，同時其可以識別人類需求中需要動態(tài)決策的部分，將自動編排進工作流中，并在工作流執(zhí)行到該部分時主動接管工作流的執(zhí)行完成相應復雜決策。

為了探索 APA 的可能性，該研究工作實現(xiàn)了一個自動化智能體 ProAgent，其可以接收人類指令，以生成代碼的方式構(gòu)建工作流，同在工作流中引入 DataAgent 和 ControlAgent 來在工作流中實現(xiàn)復雜數(shù)據(jù)處理與邏輯控制。ProAgent 的研究展現(xiàn)了 APA 在大模型智能體時代下的可行性，也揭示了 LLM 時代下，自動化技術(shù)的嶄新可能性。

方法介紹

在 RPA 中，工作流是由一系列工具調(diào)用組成的圖狀結(jié)構(gòu)：節(jié)點代表一個原子化的工具調(diào)用（如 Gmail、Twitter、Google Sheets），而邊代表了執(zhí)行的邏輯順序（承接、分支、循環(huán)）。一個工作流往往包含了對于一個或一類任務的所有先驗知識，其中包含解決問題的路徑，遇到異常時的處理邏輯等等。因此人編寫固化出來的工作流往往是非常穩(wěn)定周全、非常高效的。

▲圖3. 智能體工作流描述語言示例

在 ProAgent 中，由于 LLM 本身在代碼數(shù)據(jù)中進行預訓練，學習到了較強代碼能力，該研究便基于代碼的智能體工作流描述語言 Agentic Workflow Description Language。該語言使用 JSON 實現(xiàn)對工作流中數(shù)據(jù)的組織與管理，選擇 Python 語法實現(xiàn)對工作流的邏輯控制，將控制流中的跳轉(zhuǎn)、循環(huán)等直接通過 Python 語法進行表征，同時將工作流中的工具調(diào)用封裝為 Python Function。

于是對于 ProAgent，工作流構(gòu)建任務便轉(zhuǎn)化為代碼生成任務。當接收到人類指令時，ProAgent 便編寫相應的 Agentic Workflow Description Language，從而實現(xiàn)了工作流自動化構(gòu)建。

▲圖4. 結(jié)合 DataAgent 和 ControlAgent 的智能體工作流描述語言示例

復雜的現(xiàn)實任務中通常會涉及動態(tài)決策，單純的 Python 式的邏輯控制規(guī)則以及 JSON 式的數(shù)據(jù)組織形式在面對靈活的需求時便無能為力，此時便需要引入 agent。因此，該研究工作進一步定義出了兩種 Agent 操作：

1. DataAgent：對于一個復雜的數(shù)據(jù)處理需求，工作流構(gòu)建時會使用自然語言來描述處理的任務，然后在執(zhí)行時會初始化一個 DataAgent，其會基于該自然語言描述自主處理并完成該數(shù)據(jù)處理任務。

2. ControlAgent：對于難以用規(guī)則表示的邏輯控制規(guī)則，工作流構(gòu)建時使用自然語言對控制邏輯進行描述，然后在運行時會初始化一個 ControlAgent，其會基于該自然語言描述自主選擇工作流后續(xù)需要執(zhí)行的分支。

ProAgent 使用 ReACT 模式逐步構(gòu)建工作流，其共包含四個工作流構(gòu)建步驟：

1. Action_Define：決定在工作流中添加什么工具。

2. Action Implement：將工具的輸入 / 輸出參數(shù)轉(zhuǎn)化為 JSON 結(jié)構(gòu)，同時將工具的調(diào)用封裝為 Python 函數(shù)。

3. Workflow Implement：定義一個 mainWorkflow 函數(shù)，用以組織整個 workflow 的邏輯控制與數(shù)據(jù)處理。

4. Task Submit: 當 ProAgent 構(gòu)建完 workflow 時以該操作標識構(gòu)建過程結(jié)束。

▲圖5. ProAgent 工作流構(gòu)建過程示例

另外，為了優(yōu)化 ProAgent 的效果，又引入了幾個優(yōu)化技巧：

1. Testing-on-Constructing：在構(gòu)建過程中，ProAgent 會在一次修改工作流之后對工作流進行測試，以保證工作流的正確性。

2. Function Calling：工作流構(gòu)建的所有操作均封裝為了 GPT-4 的 Function，從而提高對工作流構(gòu)建過程的控制。

3. Chain-of-Thought：ProAgent 在編寫工作流代碼時，需要對于每個 function 都要給出注釋 comment 和一個編寫 plan，從而提高 ProAgent 工作流構(gòu)建的性能。

工作流執(zhí)行過程基于 Python interpreter。給定一個工作流，其對應的 mainWorkflow 函數(shù)用作為工作流執(zhí)行的入口來開始整個執(zhí)行過程。執(zhí)行過程遵循 Python 代碼執(zhí)行規(guī)則，即按照順序逐行執(zhí)行。一旦 mainWorkflow 函數(shù)返回，工作流執(zhí)行就成功完成了。

可行性驗證

為了驗證 Agentic Process Automation 的可行性，該研究使用 OpenAI GPT-4 作為基礎(chǔ)模型，并以一個開源的 RPA 平臺 n8n 作為載體，實現(xiàn)了上述的 ProAgent。同時設計了一個需要兼顧靈活與效率的任務：這是一個典型的商業(yè)場景，需要從 Google Sheets 中提取各種業(yè)務線的營利數(shù)據(jù)，同時根據(jù)業(yè)務是否屬于 2B 或是 2C，決定后續(xù)的行為。

一旦確定業(yè)務線為 2C，就會向 Slack 頻道發(fā)送一條消息。而對于 2B 的業(yè)務線，則會向相應的經(jīng)理發(fā)送一封電子郵件，其中包括對業(yè)務線的評估和簡要的盈利概況。

▲圖6. 任務 Instruction 展示

對于該任務，首先它是一個重復性的任務，對于多條產(chǎn)品線，應該走相同的處理流程。其次，分辨一個業(yè)務線是 2C 還是 2B 很難通過規(guī)則判斷，需要涉及 Agent 動態(tài)決策來判斷后續(xù)的工作流執(zhí)行操作。最后，根據(jù)撰寫業(yè)務線的評估郵件需要一定的智能，所以需要 Agent 的介入。

在 ProAgent 生成中，對于該任務，編寫出了一個包含四個原子操作，一個 DataAgent 和一個 ControlAgent 的工作流。總體過程大致如下圖所示：

▲圖7. ProAgent 工作流構(gòu)建過程展示

可以看到，ProAgent 通過自主編寫代碼的方式，自動完成了工作流的構(gòu)建過程，其中無需涉及人工介入。在需要判斷業(yè)務線是 2B 還是 2C 時，ProAgent 引入了 ControlAgent 來做判斷，ControlAgent 的 Prompt 被設置為 “Decide Whether the business line is toC or toB”。

當業(yè)務線為 2B 時，ProAgent 還引入了一個 DataAgent，其任務設置為 “Write a email of the business line of profit, together with your suggestion”，從而利用 agent 的智能來根據(jù)不同業(yè)務線的實際情況來撰寫郵件。

在工作流被編寫、固化下來以后，工作流就會根據(jù)不同的數(shù)據(jù)自動分支到不同的邏輯進行高效地數(shù)據(jù)處理了。

▲圖8. ProAgent 工作流執(zhí)行過程展示

在處理 2C 業(yè)務線數(shù)據(jù)時，ControlAgent 可以根據(jù)業(yè)務線描述判斷出當前業(yè)務線的類型，選擇調(diào)用 Slack 工具。當遇到 2B 業(yè)務線數(shù)據(jù)時，DataAgent 可以撰寫郵件發(fā)到相應經(jīng)理的郵箱中。

總結(jié)

該研究提出了大模型時代下新的自動化范式 ——Agentic Process Automation，和傳統(tǒng) Robotic Process Automation 技術(shù)相比，其可以實現(xiàn)工作流構(gòu)建的自動化，以及工作流執(zhí)行時動態(tài)決策的自動化。該研究進一步實現(xiàn)了 ProAgent 并通過實驗揭示了大模型智能體在自動化中的可行性與潛力。相信未來大模型智能體技術(shù)會幫助人類實現(xiàn)更高層次的自動化，將人類從各種繁重的勞動中解放出來。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

機器人

機器人

+關(guān)注

關(guān)注
210

文章
28103

瀏覽量
205853
python

python

+關(guān)注

關(guān)注
55

文章
4767

瀏覽量
84376
JSON

JSON

+關(guān)注

關(guān)注
0

文章
116

瀏覽量
6929
OpenAI

OpenAI

+關(guān)注

關(guān)注
9

文章
1033

瀏覽量
6378
LLM

LLM

+關(guān)注

關(guān)注
0

文章
264

瀏覽量
297

原文標題：被OpenAI帶火的Agent如何解放人力？清華NLP實驗室發(fā)布流程自動化新范式

文章出處：【微信號：zenRRan，微信公眾號：深度學習自然語言處理】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

無人機光伏巡檢系統(tǒng)解放人力新時代

?????? 無人機光伏巡檢系統(tǒng)解放人力新時代 ?????? 全球光伏發(fā)電的持續(xù)增長趨勢近年來愈發(fā)明顯。隨著環(huán)境保護意識的增強和可再生能源技術(shù)的進步，光伏發(fā)電已經(jīng)成為許多國家和地區(qū)能源結(jié)構(gòu)的重要

發(fā)表于 11-07 16:27 ?119次閱讀

無人機光伏巡檢系統(tǒng)<b class='flag-5'>解放人力</b>新時代

微軟Dynamics365集成10大自主AI Agent，引領(lǐng)智能自動化新時代

完成客服、銷售、財務、倉儲等多項業(yè)務，顯著提升工作效率。據(jù)了解，這些AI Agent采用了OpenAI最新的o1模型，其卓越的智能水平和學習能力確保了它們能夠自動執(zhí)行跨平臺的超復雜業(yè)務。在實際應用中，這些AI Agent將大大

發(fā)表于 10-23 11:25 ?281次閱讀

如何解決ChatGPT Plus信用卡支付被拒及充值步驟詳解

如何解決ChatGPT Plus信用卡支付被拒絕的問題在嘗試使用信用卡支付ChatGPT Plus服務時，如果支付被拒絕，可能是由于以下幾個核心原因：賬戶余額不足、網(wǎng)絡環(huán)境問題、賬戶被

發(fā)表于 08-07 16:22 ?1507次閱讀

OpenAI 深夜拋出王炸 “ChatGPT- 4o”， “她” 來了

當?shù)貢r間5月13日OpenAI推出ChatGPT-4o，代表了人工智能向前邁出的一大步。在GPT-4turbo的強大基礎(chǔ)上，這種迭代擁有顯著的改進。在發(fā)布會的演示中，OpenAI展示該模型的高級

發(fā)表于 05-27 15:43

電源測試系統(tǒng)如何解決電源模塊測試痛點？

電源模塊測試系統(tǒng)采取B/S結(jié)構(gòu)，通過軟件程控儀器，實現(xiàn)自動化測試，解放人力。自動化測試將測試程序簡單化，無需頻繁手動調(diào)整儀器，通過儀器指令便可程控。此外，系統(tǒng)采取無代碼開發(fā)模式，拖拽指令便可15分鐘快速搭建項目，測試效率大大提高。

發(fā)表于 03-26 16:47 ?347次閱讀

如何解決藍牙協(xié)議棧被鎖問題?

如何解決藍牙協(xié)議棧被鎖問題

發(fā)表于 03-21 08:21

微軟推出首個專為Windows定制的Agent

隨著人工智能技術(shù)的飛速發(fā)展，全球科技巨頭紛紛在這一領(lǐng)域布局。OpenAI以其強大的技術(shù)實力在視頻領(lǐng)域掀起了一場革命，而微軟則悄然對傳統(tǒng)用戶界面發(fā)起了挑戰(zhàn)。近日，微軟最新發(fā)布了一款名為UFO（UI-Focused Agent）的Agent

發(fā)表于 02-19 11:41 ?785次閱讀

微軟發(fā)布Agent框架UFO，引領(lǐng)UI交互新紀元

微軟近日宣布推出全新的Agent框架——UFO（UI-Focused Agent），旨在構(gòu)建更智能、更直觀的用戶界面交互體驗。該框架基于OpenAI的GPT-4V圖像識別模型開發(fā)，專為Windows操作系統(tǒng)上的應用程序設計，能夠

發(fā)表于 02-19 11:15 ?1098次閱讀

新火種AI|這家“中國OpenAI”，能趕超OpenAI嗎？

全面對標OpenAI，智譜AI能成為“中國的OpenAI”嗎？

發(fā)表于 01-18 17:56 ?594次閱讀

檢測電源管理芯片電壓調(diào)整率的常見方法

ATECLOUD電源管理芯片測試系統(tǒng)助力客戶解放人力，實現(xiàn)高效、快速的自動化測試。系統(tǒng)采取B/S架構(gòu)，支持互聯(lián)網(wǎng)和局域網(wǎng)，實現(xiàn)隨時隨地測試。用該系統(tǒng)測試電源芯片的電壓調(diào)整率，可以快速、準確測試，分析測試結(jié)果。

發(fā)表于 01-12 15:58 ?453次閱讀

AI Agent爆發(fā)在即！深剖AI Agent技術(shù)原理及發(fā)展趨勢

電子發(fā)燒友網(wǎng)報道（文/李彎彎）AI Agent指人工智能代理，是一種能夠感知環(huán)境、進行決策和執(zhí)行動作的智能實體。AI Agent通?；跈C器學習和人工智能技術(shù)，具備自主性和自適應性，在特定任務或領(lǐng)域

發(fā)表于 01-12 01:01 ?3748次閱讀

字節(jié)跳動否認借助OpenAI技術(shù)研發(fā)大模型，已刪除GPT生成數(shù)據(jù)

據(jù)悉，有媒體曝光，字節(jié)跳動可能涉足未公開地使用OpenAI技術(shù)來開發(fā)自家的大規(guī)模語言模型，這與OpenAI的服務條款相悖。因此，該公司的賬戶現(xiàn)已經(jīng)被OpenAI暫時禁用。

發(fā)表于 12-18 10:39 ?489次閱讀

微型5G網(wǎng)關(guān)如何滿足智能巡檢機器人應用

隨著物聯(lián)網(wǎng)、5G、邊緣計算等技術(shù)的廣泛普及，能夠替代人工的智能巡檢機器人已經(jīng)得到越來越多應用，有效解放人力資源，保障工況安全，提升廠區(qū)整體效能

發(fā)表于 12-06 17:38 ?511次閱讀

為什么Agent落地這么難？AI最大賽道Agent機遇全解析

“如果一篇論文提出了某種不同的訓練方法，OpenAI內(nèi)部會嗤之以鼻，認為都是我們玩剩下的。但是當新的AI Agent論文出來時，我們會十分認真且興奮地討論。普通人、創(chuàng)業(yè)者和極客在構(gòu)建AI Agents方面相比OpenAI這樣的公

發(fā)表于 11-25 15:54 ?1877次閱讀

ChatGPT之父被解雇董事長隨后辭職 OpenAI人事大地震

OpenAI突發(fā)人事大地震；連創(chuàng)始人都被干趴下了，ChatGPT 之父山姆-阿爾特曼（Sam Altman）已經(jīng)遭OpenAI董事會的罷免；毫無征兆的被迫下臺。此外還有OpenAI的董事會主席

發(fā)表于 11-18 11:30 ?1066次閱讀