AI Agent技術(shù)的最新進(jìn)展與改變世界的典型項(xiàng)目巡禮-Agent框架推薦

張先民 2024-08-28 發(fā)布于北京

展開全文

AI Agent技術(shù)的最新進(jìn)展與改變世界的典型項(xiàng)目巡禮

1. AI Agent 技術(shù)發(fā)展以及典型項(xiàng)目

1.0 前 AI Agent 時(shí)代

AI Agent技術(shù)的最新進(jìn)展與改變世界的典型項(xiàng)目巡禮-Agent框架推薦

在學(xué)術(shù)探索的浩瀚星空中，機(jī)器人技術(shù)領(lǐng)域的璀璨明珠莫過于Agent技術(shù)的深入研究，這一領(lǐng)域歷來是創(chuàng)新與突破的溫床?；厮葜链竽Ｐ屠顺迸d起之前，Agent技術(shù)的輝煌篇章便已悄然鋪展，諸如Alphago這樣的里程碑式案例，以其卓越的環(huán)境感知、精準(zhǔn)決策與高效行動(dòng)能力，生動(dòng)詮釋了Agent技術(shù)的閉環(huán)魅力。同時(shí)，DeepMind的Agent57在強(qiáng)化學(xué)習(xí)領(lǐng)域的游戲挑戰(zhàn)中嶄露頭角，而隨后問世的Gato則展現(xiàn)了更為廣泛的適用性，乃至OpenAI在“躲貓貓”游戲中展現(xiàn)的多智能體協(xié)作，無不預(yù)示著Agent技術(shù)的無限潛力。

展望未來，我們堅(jiān)信Agent技術(shù)將成為驅(qū)動(dòng)社會(huì)全面自動(dòng)化的核心引擎。與以往側(cè)重于結(jié)構(gòu)化環(huán)境下通過既定算法實(shí)現(xiàn)的自動(dòng)化不同，大模型的興起為Agent技術(shù)賦予了前所未有的通用性與靈活性。這一轉(zhuǎn)變，意味著Agent將能夠跨越傳統(tǒng)界限，深入人類腦力勞動(dòng)的復(fù)雜長尾領(lǐng)域，從體力到腦力，全方位推進(jìn)自動(dòng)化的深度與廣度。

大模型與Agent技術(shù)的融合，正引領(lǐng)我們步入一個(gè)全面自動(dòng)化的新紀(jì)元。大模型作為知識海洋中的自主學(xué)習(xí)者，為Agent提供了前所未有的智慧源泉，激發(fā)了其快速發(fā)展的新動(dòng)能。當(dāng)前，盡管我們?nèi)蕴幱谶@一變革的初期，Agent技術(shù)更多以實(shí)驗(yàn)性、探索性的面貌呈現(xiàn)，但展望未來，其發(fā)展前景之廣闊，變化速度之迅猛，或?qū)⒊跛腥说念A(yù)料。隨著技術(shù)的日新月異，我們或許會(huì)發(fā)現(xiàn)，所謂的“天花板”不過是通往更高境界的階梯，而Agent技術(shù)的極限，正等待著我們共同去探索與定義。

1.1 AI等級劃分

基于Agent（智能體）能力的AI等級劃分，可以借鑒類似自動(dòng)駕駛級別的劃分方式，將AI智能體的能力從低到高進(jìn)行分級。以下是一個(gè)簡化的AI Agent能力劃分描述：

AI Agent能力劃分：

L0 - 沒有人工智能在這一級別，Agent并不具備人工智能特性，只能執(zhí)行預(yù)定或固定的任務(wù)，沒有感知、決策或?qū)W習(xí)的能力。
L1 - 規(guī)則符號智能 Agent開始具備基于規(guī)則的決策能力，能夠根據(jù)預(yù)設(shè)的規(guī)則和符號進(jìn)行簡單的判斷和執(zhí)行。這種智能體通常只能處理特定情境下的任務(wù)，且缺乏靈活性和適應(yīng)性。
L2 - 推理決策智能 Agent能夠利用邏輯推理能力來解決問題，不再僅僅依賴于預(yù)設(shè)的規(guī)則。它能夠根據(jù)當(dāng)前的環(huán)境信息和目標(biāo)，進(jìn)行一定程度的推理和決策，以選擇最合適的行動(dòng)方案。
L3 - 記憶反思智能在L3級別，Agent不僅具備推理決策能力，還開始擁有記憶和反思的能力。它能夠記住過去的經(jīng)驗(yàn)和教訓(xùn)，并在未來的決策中加以利用。這種智能體能夠自我優(yōu)化和改進(jìn)，以適應(yīng)不斷變化的環(huán)境和任務(wù)。
L4 - 自主學(xué)習(xí)智能自主學(xué)習(xí)是L4級別Agent的主要特征。它能夠自主地從數(shù)據(jù)中學(xué)習(xí)新知識和技能，無需人類的明確指導(dǎo)。這種智能體能夠處理更復(fù)雜的問題，并在面對新情境時(shí)展現(xiàn)出更強(qiáng)的適應(yīng)性和創(chuàng)造力。
L5 - 個(gè)性群體智能在最高級別，Agent不僅具備高度自主的學(xué)習(xí)和決策能力，還展現(xiàn)出個(gè)性化的特征。它能夠根據(jù)自身的特點(diǎn)和偏好來執(zhí)行任務(wù)，并與其他Agent進(jìn)行協(xié)作和溝通。此外，L5級別的Agent還能夠理解和適應(yīng)人類社會(huì)的復(fù)雜性和多樣性，與人類實(shí)現(xiàn)更加緊密和自然的交互。
AI 等級劃分

AI apps building blocks

1.2 Prompt 工程

通過描述角色技能、任務(wù)關(guān)鍵詞、任務(wù)目標(biāo)及任務(wù)背景，告知大模型需要輸出的格式，并調(diào)用大模型進(jìn)行輸出
為了將 LLM 的能力發(fā)揮到極致，發(fā)展出了多種 prompt 工程
角色扮演
零樣本分析
少樣本分析
在大模型初露鋒芒之際，業(yè)界掀起了一股“Prompt工程”的熱潮，將這一先進(jìn)技術(shù)視為一種創(chuàng)新的編程范式加以探索。從業(yè)者們巧妙地將大模型轉(zhuǎn)化為高度可定制的“智能工具”，通過精心構(gòu)建的角色設(shè)定、技能描述、任務(wù)關(guān)鍵詞的精準(zhǔn)提煉、目標(biāo)導(dǎo)向的明確闡述，以及詳盡的任務(wù)背景鋪設(shè)，構(gòu)建起與模型溝通的橋梁。這一系列精心設(shè)計(jì)的指令，不僅界定了大模型需完成的任務(wù)范疇，還細(xì)化了輸出結(jié)果的格式要求，隨后通過直接調(diào)用大模型，實(shí)現(xiàn)知識的生成與輸出的無縫銜接。

這一過程，被業(yè)界形象地稱為“工具模式”，它深刻體現(xiàn)了大模型作為高級認(rèn)知工具的價(jià)值所在。在此模式下，大模型不再僅僅是靜態(tài)的數(shù)據(jù)處理器，而是轉(zhuǎn)變?yōu)槟軌蚋鶕?jù)用戶意圖靈活應(yīng)變、高效執(zhí)行復(fù)雜任務(wù)的智能助手。這種將大模型工具化的探索，不僅極大地拓寬了技術(shù)的應(yīng)用邊界，也為人工智能領(lǐng)域的研究與實(shí)踐開辟了新的思路與方向。

案例：15000 字符的 prompt 工程，扮演人類導(dǎo)師

https://github.com/JushBJJ/Mr.-Ranedeer-AI-Tutor

剛興趣的同學(xué)可以用自己嘗試一下：
https://chat./share/53b38605-68e5-4922-81fe-e4588fb28d8a

prompt 強(qiáng)化了 LLM 的能力，但以下的問題依然無法解決：

不能及時(shí)更新知識
上下文有限等等為了解決以上的問題，人們又發(fā)展出了很多的方法
1.2.1 Prompt 外掛 - RAG（Retrieval Augmented Generation）

引入向量數(shù)據(jù)庫
數(shù)據(jù)索引進(jìn)入向量數(shù)據(jù)庫
召回?cái)?shù)據(jù)
在提交給 LLM 做提示詞工程

1.2.2 分而治之 - 古老的思想依然有效

解決 context 不夠的問題
拆分成小段，分別摘要

1.2.3 step-by-step

思維鏈（Chain of Thought，CoT）：要求模型展示其思考過程，而非僅給出答案
思維樹（Tree of Thought，ToT）：它會(huì)根據(jù)當(dāng)前的問題分解出多個(gè)可能，然后每一個(gè)樹節(jié)點(diǎn)就是父節(jié)點(diǎn)的一個(gè)子問題，逐層擴(kuò)散，遍布整個(gè)解空間，一些節(jié)點(diǎn)就直接會(huì)發(fā)現(xiàn)不合適而終止掉，達(dá)到了有效剪枝的作用
思維圖（Graph of Tree，GoT）：基于思維樹，既可以分解，也可以合并 ……

思維鏈（Chain of Thought, CoT）的深化

思維鏈的引入，標(biāo)志著人工智能模型解答問題方式的重大轉(zhuǎn)變。它強(qiáng)調(diào)模型需展現(xiàn)其內(nèi)在的邏輯推理過程，而非僅僅呈現(xiàn)最終答案。這一過程可通過雙軌并行實(shí)現(xiàn)：一是詳盡闡述法，即模型被要求逐步、細(xì)致地展示其思考軌跡，確保每一步推理的透明度與邏輯性；二是范例引導(dǎo)法，通過提供包含完整思考路徑的示例問題與答案，引導(dǎo)模型在面臨新問題時(shí)模仿此過程，循序漸進(jìn)地推導(dǎo)答案。隨著實(shí)踐的深入，我們進(jìn)一步探索了CoT的潛力，發(fā)現(xiàn)當(dāng)單一思維鏈遭遇障礙時(shí)，通過發(fā)散性思考，即CoT-SC（Chain of Thought with Strategic Convergence），模型能嘗試多種解題路徑，并通過投票機(jī)制篩選出最優(yōu)解，從而增強(qiáng)了解的魯棒性與多樣性。

思維樹（Tree of Thought, ToT）的萌芽

面對CoT-SC在某些復(fù)雜問題（如24點(diǎn)游戲）上的局限性，我們轉(zhuǎn)而探索思維樹的構(gòu)建。ToT策略將問題視為一個(gè)根系龐大的樹木，其主干代表核心問題，而每一分支則是對該問題的不同分解路徑。每個(gè)節(jié)點(diǎn)代表一個(gè)子問題，隨著樹的層層展開，解空間被細(xì)致劃分，同時(shí)，不合適的分支被有效剪除，以優(yōu)化搜索效率。然而，ToT在處理需要高度整合子問題結(jié)果的任務(wù)（如排序算法中的合并步驟）時(shí)仍顯不足。

思維圖（Graph of Tree, GoT）的革新

為解決ToT的整合難題，思維圖應(yīng)運(yùn)而生。GoT不僅繼承了ToT的分解能力，更增添了靈活的合并機(jī)制，使得模型能夠在復(fù)雜問題中自由穿梭于分解與整合之間，構(gòu)建出既全面又精確的解決方案圖。這一創(chuàng)新，標(biāo)志著AI在復(fù)雜問題求解能力上的又一飛躍。

累計(jì)推理：邁向新高度的探索

清華姚期智團(tuán)隊(duì)在思維推理領(lǐng)域取得了突破性進(jìn)展，提出了累計(jì)推理方法。該方法在解決24點(diǎn)問題上已展現(xiàn)出高達(dá)98%的成功率，樹立了新的技術(shù)標(biāo)桿。其核心理念與主流Agent的實(shí)現(xiàn)方式相契合，強(qiáng)調(diào)通用性與實(shí)用性。累計(jì)推理首先孕育一個(gè)初步假設(shè)，隨后通過不斷驗(yàn)證與迭代，逐步構(gòu)建并完善推理圖。每個(gè)新節(jié)點(diǎn)都建立在穩(wěn)固的已有基礎(chǔ)上，通過發(fā)散、合并或修正，直至達(dá)成最終目標(biāo)狀態(tài)。這一過程不僅增強(qiáng)了推理的完備性，還賦予了模型前所未有的靈活性，為人工智能在更廣泛領(lǐng)域的應(yīng)用開辟了新的可能性。

1.2.4 基于反饋的 ReACT-Synergizing Reasoning and Acting

上述的討論主要是任務(wù)分解和組合，他們盡管強(qiáng)大，卻不能與外界進(jìn)行互動(dòng)，這就不得不講到反饋機(jī)制了。

ReACT機(jī)制的核心在于將推理和行動(dòng)緊密結(jié)合，使語言模型能夠交替地產(chǎn)生推理路徑（Thought）和文本動(dòng)作（Action），以解決不同的語言推理和決策任務(wù)。具體來說，ReACT通過以下幾個(gè)步驟實(shí)現(xiàn)這一目標(biāo)：

推理路徑生成：模型首先基于當(dāng)前的環(huán)境或上下文生成推理路徑（Thought），這些推理路徑包含了對問題或任務(wù)的逐步分析和理解。
文本動(dòng)作生成：在推理路徑的指導(dǎo)下，模型生成文本動(dòng)作（Action），這些動(dòng)作可以是查詢外部數(shù)據(jù)源、執(zhí)行特定操作或生成最終答案等。
環(huán)境交互與反饋：文本動(dòng)作被發(fā)送到外部環(huán)境或數(shù)據(jù)源，以獲取新的觀測值（Observation）。這些觀測值用于更新模型的內(nèi)部狀態(tài)，并作為后續(xù)推理和行動(dòng)的基礎(chǔ)。
循環(huán)迭代：上述過程不斷循環(huán)迭代，直到達(dá)到任務(wù)目標(biāo)或滿足某個(gè)終止條件

1.2.5 Reflexion

背景與動(dòng)機(jī)

傳統(tǒng)的強(qiáng)化學(xué)習(xí)方法在訓(xùn)練大型語言模型時(shí)面臨諸多挑戰(zhàn)，如需要大量的訓(xùn)練樣本和昂貴的模型微調(diào)成本。此外，傳統(tǒng)的標(biāo)量或向量獎(jiǎng)勵(lì)信號往往難以準(zhǔn)確反映智能體在執(zhí)行任務(wù)過程中的具體表現(xiàn)。Reflexion方法通過引入語言反饋機(jī)制，旨在解決這些問題，使語言智能體能夠快速有效地從錯(cuò)誤經(jīng)驗(yàn)中學(xué)習(xí)。

核心原理

Reflexion方法的核心在于將傳統(tǒng)強(qiáng)化學(xué)習(xí)中的獎(jiǎng)勵(lì)信號轉(zhuǎn)化為語言反饋信號（Verbal Reinforcement），并將其作為附加的上下文信息嵌入到大型語言模型中。具體來說，Reflexion框架包含以下幾個(gè)關(guān)鍵組件：

Actor：由大型語言模型（LLM）擔(dān)任，主要負(fù)責(zé)基于當(dāng)前環(huán)境生成下一步的動(dòng)作。
Evaluator：用于評估Actor生成結(jié)果的質(zhì)量，類似于強(qiáng)化學(xué)習(xí)中的獎(jiǎng)勵(lì)函數(shù)。Evaluator將生成的軌跡作為輸入，計(jì)算在給定任務(wù)上下文中的獎(jiǎng)勵(lì)分?jǐn)?shù)。
Self-Reflexion：自我反思模塊，也由LLM擔(dān)任。該模塊負(fù)責(zé)分析Actor的執(zhí)行結(jié)果和Evaluator的獎(jiǎng)勵(lì)信號，生成具體且詳細(xì)的語言反饋信號。這些反饋信號會(huì)儲(chǔ)存在Memory中，以便在未來的決策中提供參考。
Memory：提供短期記憶和長期記憶功能。短期記憶存儲(chǔ)當(dāng)前實(shí)驗(yàn)中的上下文信息，而長期記憶則存儲(chǔ)Self-Reflexion模塊生成的反思結(jié)果。
執(zhí)行過程

Reflexion的執(zhí)行過程是一個(gè)迭代過程，包括Actor生成動(dòng)作、Evaluator評估動(dòng)作、Self-Reflexion生成反思并存儲(chǔ)結(jié)果等步驟。通過不斷重復(fù)這個(gè)過程，智能體能夠逐漸從錯(cuò)誤經(jīng)驗(yàn)中學(xué)習(xí)，并在未來的任務(wù)中做出更好的決策。

2. AI Agent

定義

在 LLM 語境下，Agent 可以理解為某種能自主理解、規(guī)劃決策、執(zhí)行復(fù)雜任務(wù)的智能體。Agent 并非 ChatGPT 升級版，它不僅告訴你 “如何做”，更會(huì)幫你去做。如果 CoPilot 是副駕駛，那么 Agent 就是主駕駛。

2.1 AI Agent 系統(tǒng)組成

Planning（規(guī)劃）：

子目標(biāo)和分解：AI Agents 能夠?qū)⒋笮腿蝿?wù)分解為較小的、可管理的子目標(biāo)，以便高效的處理復(fù)雜任務(wù)
反思和細(xì)化：Agents 可以對過去的行為進(jìn)行自我批評和反省，從錯(cuò)誤中吸取經(jīng)驗(yàn)教訓(xùn)，并為接下來的行動(dòng)進(jìn)行分析、總結(jié)和提煉，這種反思和細(xì)化可以幫助 Agents 提高自身的智能和適應(yīng)性，從而提高最終結(jié)果的質(zhì)量

Memory（記憶）：

短期記憶：所有上下文學(xué)習(xí)都是依賴模型的短期記憶能力進(jìn)行的
長期記憶：這種設(shè)計(jì)使得 AI Agents 能夠長期保存和調(diào)用無限信息的能力，一般通過外部載體存儲(chǔ)和快速檢索來實(shí)現(xiàn)

Tool use（工具使用）：

AI Agents 可以學(xué)習(xí)如何調(diào)用外部 API，以獲取模型權(quán)重中缺少的額外信息，這些信息通常在預(yù)訓(xùn)練后很難更改，包括當(dāng)前信息、代碼執(zhí)行能力、對專有信息源的訪問等

2.2 Agent 項(xiàng)目（單/多智能體）

多智能體系統(tǒng)相較于單智能體系統(tǒng)（如AutoGPT）在多個(gè)方面展現(xiàn)出顯著的優(yōu)勢，這些優(yōu)勢使得多智能體在處理復(fù)雜任務(wù)時(shí)更為高效、靈活和穩(wěn)定。

信息處理與記憶容量優(yōu)勢
多智能體優(yōu)勢：每個(gè)Agent在多智能體系統(tǒng)中僅需關(guān)注與自身角色或任務(wù)直接相關(guān)的信息，這種模塊化的信息處理方式極大地減輕了單個(gè)智能體需要記憶和處理的數(shù)據(jù)量。因此，在面對長歷史或復(fù)雜任務(wù)時(shí)，多智能體系統(tǒng)無需像單智能體那樣維護(hù)龐大的記憶容量，降低了對模型序列長度的依賴，提高了系統(tǒng)的可擴(kuò)展性和實(shí)用性。
單智能體局限：單智能體如AutoGPT需要記住并處理所有歷史信息以做出決策，這對模型的記憶容量和計(jì)算能力提出了極高的要求。在長歷史任務(wù)中，這種需求可能導(dǎo)致性能瓶頸，限制了單智能體系統(tǒng)的應(yīng)用范圍。
穩(wěn)定性與觀點(diǎn)排除
多智能體優(yōu)勢：通過角色扮演機(jī)制，多智能體系統(tǒng)能夠模擬不同角色的視角和立場，從而有效排除某些偏見或錯(cuò)誤觀點(diǎn)的影響。這種機(jī)制使得系統(tǒng)輸出更加客觀、穩(wěn)定，提高了決策質(zhì)量。此外，不同智能體之間的交互還可以促進(jìn)新想法的產(chǎn)生和驗(yàn)證，進(jìn)一步增強(qiáng)了系統(tǒng)的創(chuàng)新性和適應(yīng)性。
單智能體局限：單智能體在執(zhí)行多任務(wù)時(shí)，由于所有任務(wù)信息都混合在一起處理，容易受到各種因素的干擾，導(dǎo)致輸出結(jié)果的不穩(wěn)定。同時(shí)，單智能體難以有效區(qū)分和排除不同任務(wù)之間的潛在沖突或錯(cuò)誤觀點(diǎn)。
可拓展性與任務(wù)分解
多智能體優(yōu)勢：多智能體系統(tǒng)通過分工協(xié)作的方式將復(fù)雜任務(wù)分解為多個(gè)相對簡單的子任務(wù)，每個(gè)智能體專注于完成一個(gè)或幾個(gè)子任務(wù)。這種任務(wù)分解策略不僅降低了單個(gè)智能體的處理難度，還提高了系統(tǒng)的整體效率和可拓展性。隨著任務(wù)復(fù)雜度的增加，只需增加相應(yīng)的智能體數(shù)量或調(diào)整智能體之間的協(xié)作策略即可應(yīng)對。
單智能體局限：單智能體在處理復(fù)雜任務(wù)時(shí)，通常需要依賴記憶節(jié)省策略（如token壓縮、關(guān)鍵信息提取等）來減少輸入給模型的context長度。然而，這些策略在極端情況下可能無法完全避免性能下降的風(fēng)險(xiǎn)，因?yàn)殚L序列處理仍然是大型語言模型面臨的一個(gè)挑戰(zhàn)。
并行探索與最優(yōu)解選擇
多智能體優(yōu)勢：多智能體系統(tǒng)能夠并行地探索多種解決方案，并通過比較和評估來選擇最優(yōu)解。這種并行探索機(jī)制不僅提高了問題求解的效率，還有助于發(fā)現(xiàn)更多潛在的優(yōu)秀解。此外，不同智能體之間的探索結(jié)果可以相互借鑒和補(bǔ)充，形成更加全面的解決方案集合。
單智能體局限：單智能體在探索解決方案時(shí)通常只能采用串行或有限的并行方式（如分支預(yù)測、多線程等），其效率受到模型處理能力和計(jì)算資源的限制。同時(shí)，由于單智能體缺乏多視角的評估機(jī)制，其選擇的解決方案可能不是全局最優(yōu)的。即使通過增加計(jì)算資源來提高并行度，也可能面臨資源分配不均、協(xié)調(diào)困難等問題。

Auto-GPT

簡介：雖然內(nèi)部設(shè)計(jì)為單個(gè)智能體，但其自我批判的邏輯被視為多智能體策略的簡化版本。AutoGPT能夠根據(jù)反饋調(diào)整其行為，體現(xiàn)了智能體自我改進(jìn)的能力。
應(yīng)用：自動(dòng)化任務(wù)執(zhí)行、問題解決、基于指令的編程任務(wù)。

例子：
https://twitter.com/SullyOmarr/status/1644750889432027136?

created login/sign up page
styled it with bootstrap created flask api for login / logout
created a local json database Took ~10 minutes at a cost of $0.50

框架結(jié)構(gòu)簡單，但其設(shè)計(jì)理念具有重要意義，后續(xù)框架設(shè)計(jì)的思路都有這個(gè)的影子

創(chuàng)建一個(gè)初始的計(jì)劃，然后進(jìn)入主循環(huán)
系統(tǒng)會(huì)讓模型判斷在當(dāng)前計(jì)劃下該進(jìn)行何種行動(dòng)，接著會(huì)執(zhí)行行動(dòng)
執(zhí)行完畢后，結(jié)果會(huì)寫入下一次循環(huán)中
如此，每次決策都會(huì)基于之前的結(jié)果、記憶和計(jì)劃，從而制定出新的行動(dòng)方案
優(yōu)點(diǎn)：

內(nèi)存和上下文管理：與 AutoGen 一樣，AutoGPT 在內(nèi)存和上下文等領(lǐng)域也表現(xiàn)出色，為需要這些功能的 LLM 應(yīng)用程序提供了優(yōu)勢。

缺點(diǎn)：

可視化構(gòu)建器依賴性：應(yīng)用程序設(shè)計(jì)依賴于可視化構(gòu)建器，這可能會(huì)限制那些寧愿用代碼定義設(shè)計(jì)的團(tuán)隊(duì)的靈活性。

AutoGen

簡介：AutoGen是一個(gè)開源框架，它通過多智能體對話來構(gòu)建下一代大型語言模型應(yīng)用。這個(gè)框架允許智能體通過對話相互協(xié)作，完成復(fù)雜任務(wù)，體現(xiàn)了智能體間的高度互動(dòng)性和任務(wù)的靈活性。
應(yīng)用項(xiàng)目：AutoGen被設(shè)計(jì)為一個(gè)通用平臺，可以應(yīng)用于自動(dòng)代碼生成、復(fù)雜問題解決、自動(dòng)化工作流程設(shè)計(jì)等領(lǐng)域。

論文鏈接：
https:///abs/2308.08155

項(xiàng)目鏈接：
https://github.com/microsoft/autogen

user_proxy (to assistant):What date is today? Compare the year-to-date gain for META and TESLA.--------------------------------------------------------------------------------assistant (to user_proxy):First, let's get the current date. We can do this using Python's built-in datetime module. Here is the Python code to get the current date:import datetime Get the current datecurrent_date = datetime.date.today()print('Today's date is:', current_date)Next, we need to get the year-to-date (YTD) gain for META (Facebook) and TESLA. We can do this by using a financial data API such as Yahoo Finance. We will need to get the stock price at the start of the year and the current stock price, then calculate the percentage change.However, as an AI, I'm unable to execute real-time web requests or access external APIs. I recommend using the `yfinance` library in Python to download the stock data. Here is an example of how you can do it:import yfinance as yf#Download stock datameta_data = yf.download('META', start='2022-01-01', end=current_date)tesla_data = yf.download('TSLA', start='2022-01-01', end=current_date)#Calculate YTD gainmeta_ytd_gain = ((meta_data['Close'][-1] - meta_data['Close'][0]) / meta_data['Close'][0]) * 100tesla_ytd_gain = ((tesla_data['Close'][-1] - tesla_data['Close'][0]) / tesla_data['Close'][0]) * 100print('META YTD gain: ', meta_ytd_gain)print('TESLA YTD gain: ', tesla_ytd_gain)Please note that you need to install the `yfinance` library before running the above code. You can install it using pip:pip install yfinancePlease replace `current_date` in the above code with the actual date you got from the first code.-------------------------------------------------------------------------------->>>>>>>> EXECUTING CODE BLOCK 0 (inferred language is python)...>>>>>>>> EXECUTING CODE BLOCK 1 (inferred language is python)...user_proxy (to assistant):exitcode: 1 (execution failed)Code output: Today's date is: 2023-10-17Traceback (most recent call last):  File '', line 4, in <module>    meta_data = yf.download('META', start='2022-01-01', end=current_date)NameError: name 'current_date' is not defined--------------------------------------------------------------------------------assistant (to user_proxy):I apologize for the confusion. The `current_date` variable was defined in the first script and it's not available in the second script. Let's combine the two scripts into one so that the `current_date` variable can be used in the second part of the script. Here is the combined script:import datetimeimport yfinance as yf#Get the current datecurrent_date = datetime.date.today()print('Today's date is:', current_date)#Download stock datameta_data = yf.download('META', start='2022-01-01', end=current_date)tesla_data = yf.download('TSLA', start='2022-01-01', end=current_date)#Calculate YTD gainmeta_ytd_gain = ((meta_data['Close'][-1] - meta_data['Close'][0]) / meta_data['Close'][0]) * 100tesla_ytd_gain = ((tesla_data['Close'][-1] - tesla_data['Close'][0]) / tesla_data['Close'][0]) * 100print('META YTD gain: ', meta_ytd_gain)print('TESLA YTD gain: ', tesla_ytd_gain)Please run this script to get the current date and the year-to-date gain for META and TESLA.-------------------------------------------------------------------------------->>>>>>>> EXECUTING CODE BLOCK 0 (inferred language is python)...user_proxy (to assistant):exitcode: 0 (execution succeeded)Code output: Today's date is: 2023-10-17[*********************100%%**********************]  1 of 1 completed[*********************100%%**********************]  1 of 1 completedMETA YTD gain:  -5.136767947511282TESLA YTD gain:  -36.50836025922416--------------------------------------------------------------------------------assistant (to user_proxy):The current date is October 17, 2023. The year-to-date (YTD) gain for META (Facebook) is approximately -5.14%, indicating a decrease in value since the start of the year.The YTD gain for TESLA is approximately -36.51%, indicating a significant decrease in value since the start of the year.Please note that these values are based on the closing prices of the stocks and can vary slightly depending on the source of the data.TERMINATE--------------------------------------------------------------------------------

優(yōu)點(diǎn)：完善：AutoGen 擁有一個(gè)非常活躍的社區(qū)，非常適合尋求支持和協(xié)作的開發(fā)人員。可定制的代理：它還提供可定制的代理，可以集成 LLM、工具和人工反饋，使任務(wù)執(zhí)行高度靈活。
缺點(diǎn)：復(fù)雜性：這是一個(gè)相當(dāng)復(fù)雜的框架，對于新用戶來說可能是一個(gè)挑戰(zhàn)，需要陡峭的學(xué)習(xí)曲線才能有效利用其功能。結(jié)構(gòu)性較差：一些開發(fā)人員可能會(huì)發(fā)現(xiàn) AutoGen 與其他框架相比結(jié)構(gòu)性較差，這可能會(huì)影響實(shí)施的難易程度。

XAgent

項(xiàng)目鏈接：
https://github.com/OpenBMB/XAgent

官方博文：
https://blog./blog/xagent/

雙循環(huán)機(jī)制
外循環(huán)負(fù)責(zé)宏觀規(guī)劃，而內(nèi)循環(huán)則負(fù)責(zé)細(xì)節(jié)的執(zhí)行
效果碾壓 AutoGPT

總結(jié)：

能力強(qiáng)大，但極耗 token，上述例子消耗了 10 刀 token
運(yùn)行極慢，單次執(zhí)行 30min
可擴(kuò)展性比較強(qiáng)，可基于 ToolServer（基于智譜的另外一個(gè)項(xiàng)目 ToolBench）擴(kuò)展自定義接口

OPENAI Assistants

參考資料Software 2.0 https://karpathy./software-2-0-a64152b37c35LLM Powered Autonomous Agents https://lilianweng./posts/2023-06-23-agent/The Rise and Potential of Large Language Model Based Agents: A Survey https:///abs/2309.07864A Survey on Large Language Model based Autonomous Agents https:///abs/2308.11432awesome ai agents https://github.com/e2b-dev/awesome-ai-agents從第一性原理看大模型 Agent 技術(shù) https://mp.weixin.qq.com/s/PL-QjlvVugUfmRD4g0P-qQ

MetaGPT

MetaGPT是一種創(chuàng)新的多智能體協(xié)作框架，其名字來源于“GPT-based Meta-Programming framework”，旨在通過分配不同的角色給生成式預(yù)訓(xùn)練變換器（GPTs），形成一個(gè)協(xié)作的軟件實(shí)體以完成復(fù)雜任務(wù)。

多智能體協(xié)作：MetaGPT的核心在于其多智能體協(xié)作的框架設(shè)計(jì)，每個(gè)GPT模型都被賦予特定的角色和任務(wù)，通過協(xié)作解決復(fù)雜問題，從而提高整體效率和性能。
標(biāo)準(zhǔn)化操作程序（SOP）：MetaGPT利用SOP來協(xié)調(diào)基于大語言模型（LLM）的多智能體系統(tǒng)，實(shí)現(xiàn)元編程技術(shù)，增強(qiáng)問題解決能力。
高度可擴(kuò)展性：隨著任務(wù)復(fù)雜度的增加，可以通過添加更多的GPT模型來擴(kuò)展MetaGPT系統(tǒng)的能力，使其能夠適應(yīng)不斷變化的需求和環(huán)境。

論文鏈接：
https:///abs/2308.00352

GitHub地址：
https://github.com/geekan/MetaGPT

優(yōu)點(diǎn)：

復(fù)雜的代理交互：MetaGPT 在支持代理之間的復(fù)雜交互方面表現(xiàn)出色，使其適用于復(fù)雜的多代理任務(wù)。
豐富的庫：它還附帶一個(gè)豐富的預(yù)定義代理庫，無需進(jìn)行大量自定義開發(fā)即可實(shí)現(xiàn)一系列功能。

缺點(diǎn)：

Asyncio 依賴性：嚴(yán)重依賴 asyncio，這對于網(wǎng)絡(luò)密集型 I/O 來說可能很好，但與其他 python 原生并行處理方法相比，它有一些相當(dāng)嚴(yán)重的限制。
有限的通用性：MetaGPT 中的代理角色可能缺乏通用性，可能會(huì)限制其在需要高度可定制代理的場景中的使用。

適合人群：需要復(fù)雜的多代理交互和預(yù)定義復(fù)雜行為的項(xiàng)目。非常適合網(wǎng)絡(luò)密集型異步操作和需要高級協(xié)作功能而無需大量定制的項(xiàng)目

AutoAgents

項(xiàng)目鏈接：
https://github.com/Link-AGI/AutoAgents

AutoAgents的過程是分為兩個(gè)關(guān)鍵階段：Drafting 階段和Execution階段。Drafting階段包括三個(gè)預(yù)定義agent（Planner、Agent Observer和Plan Observer）之間的協(xié)作討論來綜合定制的agent團(tuán)隊(duì)和適合輸入問題的執(zhí)行計(jì)劃或任務(wù)。Execution階段通過agent間協(xié)作和反饋完善計(jì)劃，以及產(chǎn)生最終結(jié)果。論文提出self-refinement ，通過個(gè)體agent和協(xié)作進(jìn)行自我完善通過多個(gè)agent進(jìn)行細(xì)化，以提高agent的熟練程度并促進(jìn)各agent之間的知識共享agents。為了促進(jìn)合成團(tuán)隊(duì)中agents之間的具體分工，作者引入預(yù)定義的agent（Action Observer）以協(xié)助agents團(tuán)隊(duì)共享信息，協(xié)調(diào)行動(dòng)，達(dá)成共識，適應(yīng)環(huán)境。

crewAI

項(xiàng)目代碼：
https://github.com/joaomdmoura/crewAI 官網(wǎng)博文：https://docs./

基于角色的Agent設(shè)計(jì)：使用特定的角色、目標(biāo)和工具來定制Agents。
自動(dòng)化的Agents間委托：agents可以自主地委托任務(wù)并在彼此之間進(jìn)行詢問，從而提高問題解決效率。
靈活的任務(wù)管理：使用可定制的工具定義任務(wù)，并將其動(dòng)態(tài)分配給agents。
流程驅(qū)動(dòng)：目前僅支持順序任務(wù)執(zhí)行，但正在研究更復(fù)雜的流程，如協(xié)商一致和分層。
優(yōu)點(diǎn)：

生產(chǎn)重點(diǎn)：CrewAI 的設(shè)計(jì)考慮到了生產(chǎn)用途，具有干凈的代碼和注重實(shí)際應(yīng)用。
代理委派：強(qiáng)調(diào)代理委派，允許在代理之間采用結(jié)構(gòu)化的方法分配任務(wù)。

缺點(diǎn)：

重新委派限制：重新委派和使用外部代理的限制可能會(huì)限制分配和執(zhí)行任務(wù)的靈活性。
數(shù)據(jù)收集：收集匿名使用數(shù)據(jù)，這可能會(huì)引起某些團(tuán)隊(duì)的隱私問題。

2020国产成人精品视频,性做久久久久久久久,亚洲国产成人久久综合一区,亚洲影院天堂中文av色