【原】智能體間協(xié)作的"巴別塔困境"如何破解？解讀Agent通信4大協(xié)議：MCP/ACP/A2A/ANP

DuerOS布道師 2025-05-18 發(fā)布于北京

展開全文

AI 智能體的興起觸發(fā)了AI應(yīng)用協(xié)作的新領(lǐng)域。這些智能體不再局限于被動的聊天機(jī)器人或獨(dú)立的系統(tǒng)，它們現(xiàn)在被設(shè)計用于推理、計劃和協(xié)作ーー跨任務(wù)、跨域甚至跨組織。但隨著這一愿景成為現(xiàn)實(shí)，一個挑戰(zhàn)很快浮出水面：智能體如何以一種安全、可伸縮和可互操作的方式可靠地相互交流、共享上下文并共同做出決策？

一類新的通信協(xié)議應(yīng)運(yùn)而生。從模型上下文協(xié)議 (MCP) 到 IBM 和思科的代理通信協(xié)議 (ACP) ，從谷歌的跨廠商代理對代理協(xié)議 (A2A) 到去中心化的代理網(wǎng)絡(luò)協(xié)議 (ANP) ，這些協(xié)議正在競相定義智能體在AI時代如何協(xié)調(diào)。

這些方法都帶來了獨(dú)特的優(yōu)勢，不是理論上的，它們正在被實(shí)現(xiàn)、試驗(yàn)和標(biāo)準(zhǔn)化ーー幫助開發(fā)人員解決當(dāng)前的問題，并使第一波自治系統(tǒng)能夠在生產(chǎn)環(huán)境中運(yùn)行。它們對互操作性、上下文共享和安全通信的貢獻(xiàn)不僅僅是有價值的，而且可能是必不可少的。

1. MCP ：結(jié)構(gòu)化上下文注入

Anthropic引入的模型上下文協(xié)議 (Model Context Protocol，MCP) 定義了一個標(biāo)準(zhǔn)化的接口，用于向大模型提供結(jié)構(gòu)化的實(shí)時上下文。使得像 GPT 或 DeepSeek這樣的語言模型可以訪問工具和知識，減少了對硬編碼集成或自定義流水線的需求，允許開發(fā)人員將 “實(shí)時” 信息插入其他靜態(tài)模型

一個通俗一點(diǎn)的類比，可以將其視為大模型的通用適配器。它確保不同的應(yīng)用程序可以輕松地插入它們的數(shù)據(jù)和函數(shù)，以便大模型可以有效地使用它們，而不管它們來自哪個源。

MCP的核心功能是上下文數(shù)據(jù)注入。MCP 允許外部資源 (如文件、數(shù)據(jù)庫行或 API 響應(yīng)) 直接拉入提示詞或工作內(nèi)存。所有這些都通過標(biāo)準(zhǔn)化的接口實(shí)現(xiàn)，因此大模型可以保持輕量且干凈。MCP 還允許大模型動態(tài)地調(diào)用工具或者生成報告，并且按需調(diào)用。這就像給AI增加了一個可以訪問一個工具箱，而且沒有硬連接到模型本身的工具箱。MCP不是用所有可能的細(xì)節(jié)來填充提示詞，而是幫助組合重要的背景信息，采用模塊化的、即時的提示詞構(gòu)建，使用更智能的背景信息，更少的token，得到更好的輸出。

MCP使用基于 json 的能力描述符在 HTTP (s) 上運(yùn)行，在設(shè)計上是為與模型無關(guān)，任何具有大模型都可以利用兼容MCP的服務(wù)器。而且，與 API 網(wǎng)關(guān)和企業(yè)認(rèn)證標(biāo)準(zhǔn) (如 OAuth2) 兼容。

MCP 的典型應(yīng)用場景是內(nèi)部API與大模型的集成，支持對結(jié)構(gòu)化業(yè)務(wù)數(shù)據(jù)的安全、只讀或交互式訪問，而不暴露原始端點(diǎn)，能夠?yàn)樽灾沃悄荏w配備來自 Salesforce、 SAP 或內(nèi)部知識庫等工具的運(yùn)行時上下文。同時，根據(jù)用戶會話、系統(tǒng)狀態(tài)或任務(wù)流水線邏輯定制提示詞。

MCP非常適用于業(yè)務(wù)或基于云的智能體生態(tài)系統(tǒng)中的多智能體工作流，使用標(biāo)準(zhǔn)化的 api 和 JSON 模式，旨在使用規(guī)劃邏輯衡量AI之間的協(xié)作努力?；贛CP的智能體并不對物理世界進(jìn)行推理，它們只提取數(shù)據(jù)、處理數(shù)據(jù)，然后根據(jù)事先訓(xùn)練和提示指令輸出結(jié)果。智能體的理解是根據(jù)上下文注入的，而不是自我建模的。

2. ACP：受控環(huán)境中的結(jié)構(gòu)化協(xié)作

智能體通信協(xié)議 (Agent Communication Protocol，ACP) 是一個開放標(biāo)準(zhǔn)，最初由 BeeAI 和 IBM 提出，用于支持在同一局部或邊緣環(huán)境中運(yùn)行的 AI 智能體之間的結(jié)構(gòu)化通信、發(fā)現(xiàn)和協(xié)作。

一個通俗的類比，我們可以把它想象成 AI 智能體的郵政服務(wù)ーー ACP 定義了 “信封”(消息格式) 和傳遞規(guī)則，這樣使用不同堆棧的智能體仍然可以交換有意義的信息。與面向云的協(xié)議 (如 A2A) 或上下文路由協(xié)議 (如 MCP) 不同，ACP 是為本地優(yōu)先的實(shí)時代理編排而設(shè)計的，具有最小的網(wǎng)絡(luò)開銷和在共享運(yùn)行時內(nèi)部署的智能體之間的緊密集成。

ACP 定義了一個去中心化的代理環(huán)境，其中每個智能體使用本地廣播/發(fā)現(xiàn)層公布其身份、功能和狀態(tài)。智能體通過事件驅(qū)動的消息傳遞進(jìn)行通信，通常使用本地總線或 IPC (進(jìn)程間通信) 系統(tǒng)，可選的運(yùn)行時控制器可以編排智能體行為、聚合遙測和執(zhí)行策略。ACP 智能體通常作為輕量級、無狀態(tài)的服務(wù)或具有共享通信底層的容器運(yùn)行。

ACP專為低延遲環(huán)境設(shè)計 (例如，本地協(xié)調(diào)、機(jī)器人、離線邊緣 AI)，可以通過 gRPC、 ZeroMQ 或自定義運(yùn)行時總線實(shí)現(xiàn)。ACP強(qiáng)調(diào)本地自主權(quán)限，而不需要云依賴或外部服務(wù)注冊，同時支持自動任務(wù)路由的功能和語義描述符。

ACP的典型應(yīng)用場景是邊緣設(shè)備上的多智能體協(xié)調(diào) (例如，無人機(jī)、物聯(lián)網(wǎng)集群或機(jī)器人艦隊)，本地優(yōu)先的大模型系統(tǒng)協(xié)調(diào)調(diào)用，支持傳感器輸入和操作執(zhí)行。鑒于自治的運(yùn)行時環(huán)境，智能體能夠在沒有云基礎(chǔ)設(shè)施的環(huán)境下進(jìn)行協(xié)調(diào)。

簡而言之，ACP 為模塊化 AI 系統(tǒng)提供了本地協(xié)議層的運(yùn)行時，優(yōu)先考慮低延遲協(xié)調(diào)、彈性和可組合性。對于隱私敏感、自治或邊緣優(yōu)先的部署來說，這是很自然的選擇，因?yàn)樵谶@些環(huán)境中云優(yōu)先的部署中是不切實(shí)際的。

3.A2A：跨廠商智能體的互操作性

由 Google 引入的 Agent-to-Agent (A2A) 協(xié)議是一個跨平臺規(guī)范，用于使 AI 智能體能夠跨異構(gòu)系統(tǒng)進(jìn)行通信、協(xié)作和委托任務(wù)，并以結(jié)構(gòu)化格式返回結(jié)果。與 ACP 的本地優(yōu)先或 MCP 的工具集成層不同，A2A 解決了水平互操作性問題，能夠?qū)碜圆煌?yīng)商或運(yùn)行時的智能體進(jìn)行標(biāo)準(zhǔn)化，并在開放網(wǎng)絡(luò)上交換功能集和協(xié)調(diào)工作流。

一個通俗一點(diǎn)的類比，我們可以想象一個項目管理平臺，其中 AI 智能體可以看到彼此的技能并委托任務(wù)。A2A 為他們?nèi)绾螀f(xié)調(diào)和共享他們的工作 (“工件”) 提供了規(guī)則。

A2A選擇使用Task來作為核心的概念，Task是比MCP中的Tools、Resources等抽象級別更高的概念。A2A 定義了一個基于 http 的通信模型，其中智能體被視為可互操作的服務(wù)。智能體利用一個機(jī)器可讀的 JSON 描述符來通過編程發(fā)現(xiàn)彼此，協(xié)商任務(wù)和角色，交換消息、數(shù)據(jù)和流更新。A2A 原則上與傳輸層無關(guān)，但目前指定基于HTTPS 的JSON-RPC 2.0 作為其交互的核心機(jī)制。

A2A協(xié)議的核心組件如下：

Agent Cards： json 文檔，描述了代理的功能、端點(diǎn)、支持的消息類型、身份驗(yàn)證方法和運(yùn)行時元數(shù)據(jù)。
A2A 客戶機(jī)/服務(wù)器接口：每個智能體可以作為客戶機(jī) (任務(wù)發(fā)起者)、服務(wù)器 (任務(wù)執(zhí)行者) 或兩者兼而有之，從而支持動態(tài)任務(wù)路由和協(xié)商。
消息和工件交換：支持具有上下文的多部分任務(wù)、流輸出 (通過 SSE) 和持久化工件 (例如文件、知識模塊)。
用戶體驗(yàn)協(xié)商：智能體可以調(diào)整消息格式、內(nèi)容粒度和可視化，以匹配下游代理的功能。

A2A基于OAuth 2.0 和基于密鑰的 API 進(jìn)行授權(quán)，也就是說，A2A基于 HTTP、 JSON-RPC 和標(biāo)準(zhǔn) web 的安全性完成構(gòu)建，是web原生的安全性設(shè)計。智能體只公開聲明的交互所需的函數(shù)來明確端點(diǎn)的能力范圍，以在 “不透明” 模式下運(yùn)行，隱藏內(nèi)部邏輯，同時顯示可調(diào)用的服務(wù)。A2A具有模型無關(guān)性，能夠與任何實(shí)現(xiàn)該協(xié)議的智能體系統(tǒng)(例如，大模型或其他服務(wù)) 一起工作，支持任務(wù)流和輕量級有效負(fù)載的多輪協(xié)作。

A2A的典型應(yīng)用場景是對來自不同團(tuán)隊或供應(yīng)商的智能體進(jìn)行安全互操作，形成跨平臺的智能體生態(tài)系統(tǒng)。其中，采用了云原生AI境中的分布式智能體編排，例如，Vertex AI，LangChain，HuggingFace 智能體s等。作為一個多智能體協(xié)作框架，能夠支持跨多個企業(yè)系統(tǒng)的AI 工作流，解決了 crm、 HR 系統(tǒng)或生產(chǎn)力代理等工具之間的互操作性問題，得到了主要企業(yè)供應(yīng)商的支持。

4. ANP：Web智能體的未來

在當(dāng)前所有的代理協(xié)議中，代理網(wǎng)絡(luò)協(xié)議 (ANP) 最符合主動推理和空間網(wǎng)絡(luò)的要求。ANP 建立在分布式標(biāo)識符 (distributed identifiers，DIDs) 和 JSON-LD 鏈接數(shù)據(jù)之上，它允許智能體在語義上描述自己，在全局范圍內(nèi)發(fā)現(xiàn)彼此，并進(jìn)行對等通信。

我們做一個簡單的類比，想象一個全球性的，安全的AI 智能體在線市場，ANP 為智能體提供了 id (如數(shù)字護(hù)照) 和規(guī)則，以發(fā)現(xiàn)彼此，證明他們的身份，并公開和安全地協(xié)作。協(xié)議本身會攜帶身份信息、身份驗(yàn)證信息，目前主要是使用W3C的DID方案，一個智能體可以用自己的身份信息，與其他所有的智能體進(jìn)行交互，不必在其他智能體平臺申請賬號。ANP采用了去中心化的身份安全通信，基于關(guān)聯(lián)數(shù)據(jù)的語義建模，通過開放注冊表或搜索索引智能體的描述進(jìn)行發(fā)現(xiàn)。

ANP的核心概念是Interface，包括自然語言接口和結(jié)構(gòu)化接口，將智能體交互方式的定義下放到了Interface中，支持自主發(fā)現(xiàn)、去中心化身份驗(yàn)證和語義推理，雖然 ANP 目前不支持像 rgm 這樣的預(yù)測或分層推理體系結(jié)構(gòu)，但是它的基礎(chǔ)設(shè)施可以提供傳輸和發(fā)現(xiàn)層的智能體。

ANP的智能體描述則是基于JSON-LD和http://，這是語義網(wǎng)的技術(shù)，具體可以參考《從語義網(wǎng)到知識圖譜》一文。其目的是提高兩個智能體對信息理解的一致性。ANP采用的是語義網(wǎng)的Linked-Data技術(shù)，目標(biāo)是構(gòu)建一個便于AI訪問和理解的AI原生數(shù)據(jù)網(wǎng)絡(luò)。

同樣，ANP可能缺乏共享的全局上下文和空間網(wǎng)絡(luò)提供的事務(wù)性知識圖譜。它能夠連接智能體，但不連接它們的環(huán)境。這或許是空間網(wǎng)絡(luò)開始接管的地方。

5.智能體間通信協(xié)議的思考

在一定意義上，A2A 和 MCP 是互補(bǔ)的，它們解決的是AI 智能體完全不同的部分，而且它們實(shí)際上可以配合得非常好?？梢园?MCP 看作是讓AI 智能體接入世界的協(xié)議， MCP使智能體能夠訪問文件、 api 和數(shù)據(jù)庫，基本上就是他們做一些有用的事情所需要的所有結(jié)構(gòu)化上下文。無論是提取實(shí)時銷售數(shù)據(jù)還是生成自定義報告，MCP 都處理與工具和數(shù)據(jù)的連接。A2A 是智能體開始合作的地方，A2A 為他們提供了一種共享的語言和一套規(guī)則來發(fā)現(xiàn)彼此、委派任務(wù)、協(xié)商他們?nèi)绾我黄鸸ぷ鳗`ー即使他們是由不同的供應(yīng)商構(gòu)建或運(yùn)行在不同的平臺上。

簡單而言，MCP 連接AI和工具，而A2A 連接 AI 和其他 AI，它們共同構(gòu)成了構(gòu)建智能協(xié)作系統(tǒng)的強(qiáng)大模塊基礎(chǔ)。

ACP采用了完全不同的方法。這完全是本地優(yōu)先代理協(xié)調(diào)的問題，不需要云服務(wù)。ACP 不使用 HTTP 和基于 web 的發(fā)現(xiàn)，而是允許代理在共享運(yùn)行時內(nèi)部相互查找和通信。這非常適用于帶寬有限或者需要低延遲 (比如機(jī)器人技術(shù)或者設(shè)備上的助手) 的場景, 或者隱私級別很高，以及在沒有互聯(lián)網(wǎng)的環(huán)境中部署 (例如，工廠車間、邊緣節(jié)點(diǎn))。

ACP 并非試圖與 A2A 競爭，它只是填補(bǔ)了一個不同的利基市場。但是在一些設(shè)置中，特別是在嚴(yán)格控制的環(huán)境中，ACP 可能完全取代 A2A，因?yàn)樗^了 web 本地協(xié)議的開銷，只是在本地完成工作。

ANP 則像是充滿了互聯(lián)網(wǎng)情懷方法，實(shí)現(xiàn)智能體在互聯(lián)網(wǎng)上的連接與協(xié)作。ANP的最大價值在于社區(qū)對未來智能體互聯(lián)網(wǎng)的設(shè)想，是社區(qū)獨(dú)特的互聯(lián)網(wǎng)理念（連接即權(quán)力），以及DID+語義網(wǎng)的技術(shù)路線。這可能是ANP演進(jìn)的核心動力。

MCP/ACP/A2A 使用注冊表或服務(wù)描述符 (如代理卡) 來公布代理功能。每個協(xié)議都定義了自己的發(fā)現(xiàn)方法，通常需要一個已知的目錄或端點(diǎn)。ANP 更進(jìn)一步，通過 JSON-LD 和 did 實(shí)現(xiàn)去中心化發(fā)現(xiàn)，使代理具有自主身份和開放 web 上的語義可見性。

特性	MCP	ACP	A2A	ANP
功能聚焦	面向大模型的上下文注入	智能體的本地協(xié)作	跨平臺的智能體通信	跨平臺跨網(wǎng)絡(luò)的智能體通信
通信模型	客戶機(jī)/服務(wù)器（host/server 模型）	去中心化的本地運(yùn)行時	基于HTTP的客戶機(jī)/服務(wù)器，采用智能體Cards	基于HTTP的客戶機(jī)/服務(wù)器，采用JSON-LD
應(yīng)用范圍	垂直集成（模型調(diào)用工具）	本地優(yōu)先的智能體運(yùn)行時	智能體之間的水平集成	開放網(wǎng)絡(luò)中智能體之間的水平集成
發(fā)現(xiàn)機(jī)制	在服務(wù)器上的工具注冊	本地廣播/運(yùn)行時注冊	HTTP上的A2A.json	HTTP 上的智能體-descriptions
傳輸協(xié)議	HTTP(s),JSON	IPC,ZeroMQ,gRPC(靈活）	HTTP(s),JSON-RPC2.0	HTTP(s), JSON-LD
安全模型	App層驗(yàn)證，OAuth2，有范圍的API	運(yùn)行時沙箱，私有網(wǎng)絡(luò)的安全性	OAuth2，受限的開放端點(diǎn)	W3C DID技術(shù)構(gòu)建去中心化的身份認(rèn)證
適用場景	大模型應(yīng)用訪問外部數(shù)據(jù)或外部工具	邊緣智能，嵌入式系統(tǒng)，離線智能體	跨平臺多智能體工作流	跨網(wǎng)絡(luò)跨平臺的多智能體工作流
用例	大模型連接一組內(nèi)部的API	設(shè)備內(nèi)的多個小智能體協(xié)調(diào)	企業(yè)級分布式智能體的協(xié)作	互聯(lián)網(wǎng)分布式智能體的協(xié)作

接下來，一種理想的情況是各協(xié)議趨同互補(bǔ)。設(shè)想一個統(tǒng)一的智能體平臺，其中 A2A 處理企業(yè)內(nèi)部智能體之間的來回操作，MCP 管理對工具和數(shù)據(jù)的訪問，ACP風(fēng)格的運(yùn)行時插件用于邊緣或離線場景，ANP則可以安全地使用互聯(lián)網(wǎng)上的各種智能體。一切正常運(yùn)行，開發(fā)人員可以在此基礎(chǔ)上進(jìn)行構(gòu)建，而無需擔(dān)心哪個協(xié)議在幕后做什么。最壞的情況是支離破碎，不同的供應(yīng)商推出不同風(fēng)格的MCP/ACP/A2A/ANP ，結(jié)果就是一團(tuán)糟，就像 web 服務(wù)的早期，沒有大量的膠水代碼，什么都不能與其他任何東西進(jìn)行交互。

開源工具和中間件可以挽救這種局面。這些項目位于代理和協(xié)議之間，抽象出它們之間的區(qū)別，并為開發(fā)人員提供一個干凈、統(tǒng)一的 API ーー同時根據(jù)代理運(yùn)行的位置和方式在底層進(jìn)行轉(zhuǎn)換。

6.小結(jié)

MCP，ACP，A2A，ANP基本上都能夠使智能體相互發(fā)現(xiàn)對方、協(xié)商任務(wù)和直接共享消息。在大多數(shù)情況下，每個智能體管理自己的本地狀態(tài)和上下文。

MCP 簡化了智能體訪問工具和數(shù)據(jù)的方式。
ACP 為企業(yè)智能體生態(tài)系統(tǒng)引入了本地結(jié)構(gòu)化協(xié)作。
A2A 通過創(chuàng)建共享任務(wù)語言解決了供應(yīng)商鎖定問題。
ANP 推進(jìn)了代理身份和發(fā)現(xiàn)的去中心化愿景。

雖然 MCP、 ACP、 A2A 和 ANP 都在解決當(dāng)今的智能體通信需求方面取得了長足的進(jìn)步，但它們都誕生于一個特定的環(huán)境 —— AI 智能體，并在當(dāng)前的互聯(lián)網(wǎng)結(jié)構(gòu)中運(yùn)行。隨著向主動推理智能體和分布式智能的演進(jìn)，可能都有其局限性。