?? 本文將帶您快速瀏覽這份重磅報(bào)告的核心亮點(diǎn)。 什么是AI Agent? 它是一個(gè)旨在通過(guò)感知環(huán)境并利用工具采取行動(dòng)實(shí)現(xiàn)特定目標(biāo)的應(yīng)用程序。Agent的核心在于其推理、邏輯以及訪問(wèn)外部信息的能力。Agent的架構(gòu)包含三個(gè)基本要素:模型(Model)、工具(Model)和編排層(Orchestration layer)。 將AI Agent從概念驗(yàn)證階段推向生產(chǎn)環(huán)境并非不容易。報(bào)告引入了“Agent Ops”(Agent Operations)的概念。Agent Ops是指在生產(chǎn)環(huán)境中管理、監(jiān)控、評(píng)估和優(yōu)化自主人工智能體的一套工具和實(shí)踐,類(lèi)似傳統(tǒng)的DevOps(開(kāi)發(fā)運(yùn)維)或MLOps(機(jī)器學(xué)習(xí)運(yùn)維),但專(zhuān)門(mén)針對(duì)AI agent的獨(dú)特需求。 ![]() 圖:DevOps、MLOps與AgentOps的關(guān)系 衡量與優(yōu)化:Agent的成功指標(biāo)與評(píng)估 Agent的成功需要通過(guò)明確的指標(biāo)來(lái)衡量。報(bào)告強(qiáng)調(diào)了Agent特有的評(píng)估方法: 1、評(píng)估Agent能力:考察Agent理解指令、邏輯推理等核心能力,可以參考公開(kāi)基準(zhǔn)測(cè)試。 2、評(píng)估軌跡與工具使用:分析Agent解決問(wèn)題的步驟,包括工具選擇、策略和效率。這對(duì)于調(diào)試和優(yōu)化Agent至關(guān)重要,可以通過(guò)精確匹配、順序匹配、任意順序匹配、精確率、召回率等指標(biāo)進(jìn)行自動(dòng)化評(píng)估。 3、評(píng)估最終響應(yīng):評(píng)估Agent最終輸出的質(zhì)量、相關(guān)性和正確性??梢允褂米詣?dòng)化評(píng)估器(如LLM作為評(píng)判者)或人工評(píng)估。 報(bào)告特別指出,自動(dòng)化評(píng)估是提高效率的關(guān)鍵,但人工評(píng)估(Human-in-the-Loop)同樣不可或缺。 ![]() 表:自動(dòng)化Agent評(píng)估方法的優(yōu)劣勢(shì)對(duì)比 協(xié)同的力量:多Agent系統(tǒng) 報(bào)告深入探討了多Agent架構(gòu),即多個(gè)專(zhuān)業(yè)Agent協(xié)同工作以實(shí)現(xiàn)復(fù)雜目標(biāo)。這就像一個(gè)專(zhuān)家團(tuán)隊(duì),每個(gè)成員負(fù)責(zé)特定領(lǐng)域,共同解決問(wèn)題。 多Agent系統(tǒng)相比單一Agent系統(tǒng)具有顯著優(yōu)勢(shì):增強(qiáng)準(zhǔn)確性(比如Agent間可相互驗(yàn)證)、提高效率(比如Agent可并行工作)、更好地處理復(fù)雜任務(wù)(比如可以將大任務(wù)分解)、增強(qiáng)可擴(kuò)展性(可輕松添加更多Agent)、提高容錯(cuò)性(類(lèi)似魯棒性原理,單個(gè)Agent失敗不影響整體)、減少幻覺(jué)和偏差(可結(jié)合多Agent視角) 報(bào)告介紹了多Agent系統(tǒng)的設(shè)計(jì)模式,如順序型、層級(jí)型、協(xié)作型、競(jìng)爭(zhēng)型等,并討論了多Agent系統(tǒng)面臨的挑戰(zhàn)(如任務(wù)溝通、任務(wù)分配、協(xié)調(diào)推理等)及評(píng)估方法。 ![]() 圖:不同的多Agent拓?fù)浣Y(jié)構(gòu)示意圖 RAG的演進(jìn):Agentic RAG Agentic RAG(Agentic Retrieval-Augmented Generation)是RAG(檢索增強(qiáng)生成)的重要演進(jìn)。傳統(tǒng)的RAG依賴(lài)靜態(tài)檢索,難以處理模糊、多步驟或多視角的查詢(xún)。Agentic RAG則可以通過(guò)迭代推理主動(dòng)優(yōu)化搜索,實(shí)現(xiàn)更準(zhǔn)確、可解釋和適應(yīng)性強(qiáng)的響應(yīng)。 報(bào)告強(qiáng)調(diào),優(yōu)化底層搜索是Agentic RAG的基礎(chǔ),并列舉了提升搜索性能的關(guān)鍵技術(shù)。 ![]() 圖:Agentic RAG示意圖 Agent在企業(yè)中的應(yīng)用 Agent正在改變企業(yè)的工作方式,提升員工生產(chǎn)力并實(shí)現(xiàn)自動(dòng)化。未來(lái)的知識(shí)工作者將成為“Agent管理者”,協(xié)調(diào)、監(jiān)控和管理Agent團(tuán)隊(duì)。報(bào)告區(qū)分了兩類(lèi)企業(yè)Agent: 1、“助手”型Agent:與用戶互動(dòng),執(zhí)行特定任務(wù)并提供結(jié)果(如會(huì)議安排、數(shù)據(jù)分析等)。 2、“自動(dòng)化”型Agent:在后臺(tái)運(yùn)行,監(jiān)聽(tīng)事件,監(jiān)控系統(tǒng)/數(shù)據(jù)變化,并自主決策和行動(dòng)。 ![]() ![]() Agent的未來(lái):從Agent到“承包商” 報(bào)告提出了一個(gè)更高級(jí)的概念:“合同式Agent”(Contract adhering agents),旨在解決高風(fēng)險(xiǎn)場(chǎng)景下的復(fù)雜任務(wù)。核心思想是通過(guò)明確定義Agent與請(qǐng)求者之間的“合同”,精確指定預(yù)期結(jié)果、可驗(yàn)證的規(guī)范,并支持任務(wù)協(xié)商和反饋機(jī)制。這使得Agent能夠根據(jù)合同進(jìn)行自我驗(yàn)證和迭代改進(jìn)。 ![]() 圖:Agent作為承包商 真實(shí)世界案例:汽車(chē)AI中的多Agent架構(gòu) 報(bào)告以汽車(chē)對(duì)話式AI為例,展示了多Agent架構(gòu)在實(shí)際場(chǎng)景中的應(yīng)用。通過(guò)導(dǎo)航Agent、媒體搜索Agent、消息撰寫(xiě)Agent、汽車(chē)手冊(cè)Agent和通用知識(shí)Agent等專(zhuān)業(yè)Agent的協(xié)同,實(shí)現(xiàn)了流暢的車(chē)載體驗(yàn)。 ![]() 圖:汽車(chē)AI中應(yīng)用的層級(jí)型多Agent模式 |
|
來(lái)自: mrjiangkai > 《我的圖書(shū)館》