AI进阶科普！A2A、MCP协议到底是什么？

2天前推荐：数字生命卡兹克评论有奖阅读本文需 17 分钟

收藏 7

点赞 31

AI进阶科普！A2A、MCP协议到底是什么？

昨天晚上，Google 发了一个关于 Agent 的新开放协议。

叫 Agent2Agent，简称 A2A。

AI进阶科普！A2A、MCP协议到底是什么？

包括昨天阿里云百炼也官宣搞 MCP 了。

这些本来没打算写的，因为太技术了，也是感觉离普通人还是有很大距离。

但是有好几个朋友都在群里说。。。

AI进阶科普！A2A、MCP协议到底是什么？

那还是来聊聊吧，正好也用我自己的理解，来做个小科普，让大家看懂A2A、MCP，到底是个啥。

更多AI干货：

高手总结！10个我最常用的DeepResearch提示词模板和用法

昨天写了一篇关于 Gemini 的文章，里面很大篇幅聊了关于 DeepResearch，没想到把我非常喜欢的号小声比比都炸出来了。

正好最近特朗普对等关税这事，非常火。

搞得全世界鸡犬不宁，每个国家之间的隔阂，好像又重新出现了。

我就用国与国之间的外交，来去解释这两个协议。不要以为八竿子打不着，其实真的非常的像。

我们现在，假设每个 AI 智能体（Agent）就是一个小国家，它们各自有自己的语言和规矩。

AI进阶科普！A2A、MCP协议到底是什么？

现在，这些国家的大使馆分布在同一栋大楼里，试图互相沟通、做生意、交换情报。

理想情况是，各国之间关系和睦，大家都有一套明晰的外交规则，只要大家坐在圆桌前，就能顺畅地交流、签署协议、并合作进行国际项目。

但现实却是，每个国家的大使馆互不统属，协议各异，有的只认英制度量衡，有的只收欧元货币，有的说谈判必须用法语，有的则坚持任何通信都要用自家加密算法……

结果，你想跟 A 国谈一个简单的贸易合作，得先备齐对方要求的一大堆条文、证明、翻译、特殊密钥。如果你还想同时跟 B 国、C 国合作，那就得重复 N 遍相似的流程。

这种临时的、分散的、多头的各国各自为政，让所有人的沟通成本居高不下，每次对话都要额外缴一份信息关税。

过去，AI 世界里的 Agent 想要合作，都面临一样的窘境。

举个例子，你可能有一个自动帮你回邮件的 Agent，还有一个内置在日历应用里的 Agent，能帮你安排日程。

但这两个 AI 很难直接对话，必须得你充当翻译，在中间手动复制粘贴信息，或者依赖开发者定制的接口。贼恶心。

结果就是，AI 智能体各据山头，互操作性极差，这种碎片化现状让很多用户头疼，因为需要在多个 AI 应用间来回切换，也限制了 AI 的潜力发挥，很多本可以多 Agent 协同完成的复杂任务，被人为隔断在各自的小圈子里。

这种局面下，就有点像二战后世界的状态：每个 AI 智能体各自为政，缺乏统一规则，互通有壁垒。

当年二战后，也就是 1940 年代，美国寻求建立一套战后多边机构，其中之一将致力于重建世界贸易，搞了很多轮的谈判。

AI进阶科普！A2A、MCP协议到底是什么？

最后，历经 50 年，终于 1995 年 1 月 1 日正式开始运作，依据 1994 年马拉喀什协议，取代了 1948 年建立的关税与贸易总协定。

我们有了人类历史上也是非常伟大的组织：

WTO，世界贸易组织。

而现在 AI 世界的生态，就有点像二战后的废墟，WTO 成立的前夕，你调用我的功能要按我的接口来，我访问你的数据也得敲你定的门路。

没有标准，意味着每增加一种合作关系，都要付出额外“关税”（开发成本和沟通成本）。
AI 生态因此变得割裂且低效。

人人设墙，自扫门前雪。

但是还好，在 AI 圈里也出现了想要制定通用规则的势力，就想大家在贸易混战中渴望一个 WTO 那样。

AI 行业开始探讨能否有一套大家都认可的协议，让智能体之间、智能体与工具之间互相对接更加顺畅。

这时候，Google 和 Anthropic 分别站了出来，各自抛出了一个方案，也就是我们今天的主角：A2A 协议和 MCP 协议。

一、A2A 协议

先来看 Google 发布的 A2A 协议。

A2A（Agent-to-Agent）协议，顾名思义，就是让 AI 代理彼此直接对话、协同工作的协议。

AI进阶科普！A2A、MCP协议到底是什么？

这次 Google 得到了包括 Salesforce、SAP、ServiceNow、MongoDB 等在内的 50 多家科技公司的支持参与。

AI进阶科普！A2A、MCP协议到底是什么？

A2A 协议的设计初衷很简单：

让不同来源、不同厂商的 Agent 能够互相理解、协作。就像 WTO 旨在消减各国间的关税壁垒一样。

一旦采用 A2A，不同供应商和框架的 Agent 就像一个个的小国家，加入了一个自由贸易区，能够用共同语言交流、无缝协作，联手完成单个 Agent 难以独立完成的复杂工作流程。
至于 A2A 是如何运作的，我尽量用现实类比来通俗易懂的解释下：

1. Agent = 国家外交官

每个 Agent 其实就像一个国家大使馆的外交官。他的名牌上写着自己能干啥、隶属于哪家企业，联络方式如何等。A2A 要做的，就是制定一个统一的外交礼仪和沟通流程。

过去，A 国外交官只会说法语，B 国外交官只用西里尔字母写文件，C 国外交官要求面谈时必须使用古老的云纹金箔信件。。。而 A2A 的出现，就是让大家在同一个会议室开会时，都能说一套约定好的通用语言，用相同格式提交文件，让商议好的结果可以被各方理解并执行。

2. Agent Card（代理卡） = 外交国书 / 大使名片

在 A2A 规范中，每个 Agent 都要公开一份“Agent Card”，相当于其外交官的身份名片。

包含以下内容：Agent 名称、版本、能力描述、支持什么“语言或格式”等等。

现实中，外交官的身份名片让对方知道他是谁，代表哪个国家，有哪些职权。同理，在 A2A 里，Agent Card 列举了“我（这个 Agent）能执行哪些技能”、“我的认证方式是什么”、“输入输出格式有哪些”等等。

这样，其他外交官想跟你合作就能很快找到你、理解你的能力，省去了大量沟通障碍。

3. Task（任务）= 双边或多边外交项目

A2A 中最核心的概念之一是 Task。

当一个 Agent 想委托另一个 Agent 去完成什么事情，就像对外发布一份“合作项目意向书”。对方同意接单后，双方会记录一个 Task ID，追踪项目进度、交换资料、直到该 Task 完成为止。

现实外交中，某国家就可能向某兔提议：“我们想合作修一条跨境高铁，麻烦你们派工程队来。”

这就对应 A2A 的 Task：由发起方提出需求（TaskSend），远程 Agent 表示接受（Task 状态变更），然后双方在整个项目过程中随时更新任务进度

里面还有个 Artifacts（成果物），就相当于这个项目最后落地的“合同文本、建设成果”。在 AI 里可能是生成的一份报告、一张图片或任意形式的输出。而在 A2A 语言里，用 Artifact 表示最终生成的成果。

Message（消息），则是项目前期或中期的各种来回沟通。它可能包含对任务细节的补充说明、要对方再确认某些条件等。这与现实外交中的电报、照会、使节往来是一模一样的。

4. Push Notifications（推送通知）= 外交使馆快报

在 A2A 里，如果一个 Task 是长期项目，远程 Agent 需要花很久时间才能完成，比如 DeepResearch 动辄十几分钟，某些复杂的 Agent 动辄一小时，它就可以通过推送通知机制向发起方更新进度。

就像在外交中，如果一个跨国基建项目周期很长，甲国会定期给乙国发通报：“进度到哪儿了？有什么问题需要协调？”

这样能大幅提升异步协作的能力。过去很多 AI 系统比较原始，只能用同步的“请求-响应”模式，就像放一个人在那 24 小时监控，一旦响应超时就中断。

A2A 允许设置回调接口、服务器端事件（SSE）等方式，把漫长的任务分段汇报，让沟通保持流畅。

5. 身份认证与安全= 外交特权与协议

A2A 采用企业级的认证策略，要求通信双方先验证对方的身份凭证。例如在现实外交中，不是谁都能随意闯进某国大使馆，必须持有相应的外交护照、获得许可。

这就是为了防范“冒名顶替”或“恶意窃听”。

在 A2A 里，“认证头信息”“token”“签名”等一系列安全手段，就相当于外交通行证或盖了公章的外事批准文书，确保你跟我谈判时是真的代表“你所在的国家”，而不是一个假冒的第三方。

这大概，就是 A2A 的机制，其实你看，跟国与国的外交，或者跟企业与企业之间的协同，没有任何本质的区别。

二、MCP 协议

再来看 MCP 协议，全称 Model Context Protocol。

这就是 Claude 的母公司 Anthropic 在 2024 年 11 月推出并开源的一套标准。

A2A 解决了 AI 外交官之间的交流流程问题，但是还有一个棘手的现实，再能言善辩的外交官或者企业商务，要是没有任何可靠的信息来源，对国际局势和资源配置就两眼一抹黑，根本就没法干活。

更何况，在现代社会，外交官往往需要调用种种外部工具，比如签证系统、国际结算系统、情报数据库等等，才能完成任务。

同理，一个 Agent 若想承担真正的复杂职责，也需要能连上各种数据库、文档系统、企业应用，甚至是硬件设备。

这就像给外交官建立完备的情报局，并授权他们使用某些工具处理事物。

过去，Agent 要接入外部资源，常常得各自开发专用插件，与不同工具做深度整合，劳心劳力。
但是，我们现在有 MCP 了。

MCP 致力于标准化大型语言模型（LLM）与外部数据源、工具之间的交互方式。Anthropic 的官方比喻很形象：MCP 就像 AI 应用程序的 USB-C 端口。

AI进阶科普！A2A、MCP协议到底是什么？

USB-C 是如今设备通用的接口，不管充电、传数据都是一个口搞定。

MCP 的野心也是这样的，搞一个 AI 领域的万能接口，让各种模型和外部系统接驳都用同一个协议，而不是每次另写一套集成方案。

以后 AI 模型要连数据库、连搜索引擎、连第三方应用，不用每家各订各的协议，只要都支持 MCP 就能对上话。

它大概是客户端-服务器架构的思路：

1. MCP 服务器= 整合的情报局

企业或个人可以把自己的数据库、文件系统、日历、甚至第三方服务封装成一个个“MCP Server”，这些 Server 符合 MCP 协议，向外暴露统一格式的访问端点，任何 Agent 只要符合 MCP 客户端标准，就能发送请求、检索信息或执行操作。

比如高德就把自己的一些 API，封装成了 MCP，只要你有高德的 API Key，你就可以在 Agent 上调用高德。

AI进阶科普！A2A、MCP协议到底是什么？

2. MCP 客户端 = 外交官实际使用的终端设备

就像一个 Agent 外交官带着专用的终端设备，可以输入各种指令：“帮我查一下财务系统里库存数据”、“帮我向某个 API 提交请求”，“把某份 PDF 拿来我看看”。

过去，如果没有 MCP，你得针对各种系统写不同的访问代码，整合起来极其麻烦；但是用了 MCP 后，只要客户端支持协议，就能轻松切换到不同的 MCP 服务器。

调用不同的信息，随时获取情报、做业务流程。

这大概，就是 MCP 的机制。

三、A2A 和 MCP 的不同

抽象讲了很多，可能很多人，还是有点云里雾里。

别急，我们通过一个故事化的场景来把 A2A 和 MCP 的区别与合作说明白。

比如我们现在，有一个世界版的国际峰会。

各国首脑其实是各家公司的 Agent 代表，比如谷歌代表是小 G，Anthropic 派出了小 A，OpenAI 来了个小 O，国内的阿里派出小 Q，腾讯派小 T 等等。大家齐聚一堂，要合作完成一项跨国任务，比如联合写一份全球经济分析报告。

在没有通用协议之前，这会基本开不起来，因为每个代表讲自家语言，互相听不懂。

但现在好了，有了 A2A 协议这套外交标准，所有代表进入会场前都签了《A2A 维也纳外交公约》：发言必须用统一格式，说话先报身份、标明意图，回应要引用之前的发言 ID 等等。

于是，小 G 可以正式地用 A2A 格式发消息给小 O，小 O 收到后依样画葫芦地回复一个 A2A 消息。这样，不同公司的 AI 首次实现了无障碍对话。

二对话进行中，各位 AI 代表难免需要查阅资料或使用工具帮助分析。

这时候 Anthropic 的小 A 说：“各位，如果需要外部数据或工具的支持，可以通过 MCP 系统获取。”

原来，会场边上还架设了一套“MCP 同声传译室”。里面坐着各种专家（对应不同的 MCP 服务器）。

有谷歌 Drive 资料馆管理员、有 Slack 聊天记录管家、有 GitHub 代码管家，甚至还有 Postgres 数据库管理员…只要通过MCP提请求，他们就能用统一语言回应。

比如，小 Q（阿里云代表）想调自家云端数据库算点东西，如果按老办法，他得派人打个飞的回国去拿。

现在他直接在会上发送一个 MCP 请求（这请求其实也是按 MCP 定义的 JSON 格式发给对应的 MCP Server）：

“我要查询 X 数据库里的 Y 数据”。

MCP 数据库管家翻译室收到请求，立刻查库拿到结果，用 MCP 语言回复给小 Q。

整个过程对其他 Agent 来说是透明的，他们也听懂了小 Q 引用的这份数据，因为 MCP 翻译过来的格式大家都认识。

继续写报告过程中，小 G(谷歌)和小 A(Anthropic)发现需要把各自部分内容对接起来分析。
小 G 擅长数值分析，小 A 擅长语言总结，那就协作：

小 G 通过 A2A 对小 A 说“我这边算完 GDP 增速了，数据如下”，小 A 收到后，在自己这边通过 MCP 又连了一下 Excel 表格插件，验证了数据趋势，然后再用 A2A 回复小 G 一个总结段落……
一来二去，A2A 让 Agent 彼此沟通任务，MCP 让每个智能体方便地调用外部工具补充信息，两套协议配合默契，报告很快完工。

这个故事中，大家可以清楚地看到：

A2A 更像外交部专线，解决的是 Agent 直接对话的问题。

MCP 更像同声传译与资源共享系统，解决的是智能体对接外部信息的问题。

两者配合起来，就是为 AI 版联合国量身打造的沟通协定。有了它们，AI Agents 可以各展所长又紧密合作，真正形成一个互联互通的 AI 生态体系。

写在最后

当 A2A 和 MCP 这样的开放协议逐渐统一标准之后，我们有理由畅想一个全新的 AI Agent 生态。

无数 AI Agent 像网站一样部署在各处，它们通过 A2A 协议彼此发现、通信，通过 MCP 协议调动资源、分享知识。

我们作为用户，就像当年浏览网页一样，可以无感知地使用这些智能体的协同服务。比如，你的个人 AI 助理 Agent 接受了你的复杂委托：

“帮我计划一次欧洲旅行，顺便写一篇游记稿件。”

它不会单打独斗，而是迅速通过 A2A 喊来各路好手：旅行规划 Agent、航班预订 Agent、翻译 Agent、文案 Agent……

大家分工合作，各显其能。

正如我们希望国家间少打贸易战、多订规则，AI 领域我们也乐见各家少搞闭关锁国，多推行兼容协议。

A2A 和 MCP 的崛起，意味着 AI 产业已经在朝着协作而非对抗的方向进化。

现实世界，和 AI 世界，明明是一体，确实两种趋势。

真是讽刺。

最后，希望这篇文章，对你有一些帮助。

数字生命卡兹克

文章 27 人气 61.7w

AI自媒体

+关注作者

收藏 7

点赞 31

复制本文链接文章为作者独立观点不代表优设网立场，未经允许不得转载。

继续阅读本文相关话题

AIGC

你即将学会产品拆解的知识

医疗行业设计师必看！7000字深度拆解北京协和医院APP

上一篇

你即将学会 UI设计的知识

救命！为什么你的个人中心总被怼「没设计感」？

下一篇

发评论！每天赢奖品

点击登录后，在评论区留言，系统会随机派送奖品

2012年成立至今，是国内备受欢迎的设计师平台，提供奖品赞助联系我们

本期奖品

AIGC互联网产品设计实践

已累计诞生 700 位幸运星

查看获奖名单

发表评论为下方 6 条评论点赞，解锁好运彩蛋

{{ moreBtnTxt }}

以上留言仅代表用户个人观点，不代表优设立场

评论就这些咯，让大家也知道你的独特见解立即评论

阅读相关文章

数字生命卡兹克

2025/03/10

阅读 1.0w

AI创作

阿里开源推理模型QwQ-32B，性能比肩R1满血版！

又一个王炸神器！阿里新出的推理大模型有多强？

8分钟阅读

数字生命卡兹克

2025/03/13

阅读 2.4w

AI创作

用AI把PDF一键变成能玩的可视化网页，这不比PPT酷多了？

如何把一些非常难以阅读的文字报告，一键转成更舒服更易读的可视化网页，甚至还是能交互的那种？

AIGC Claude 3.7 Sonnet

10分钟阅读

数字生命卡兹克

2025/03/21

阅读 1.1w

AI创作

被低估的谷歌？聊聊Gemini 2.0最近3个超酷的新功能

AI 还远未触及顶点，人类也远未见识到它的极限。

11分钟阅读

LXDC

2023/04/26

阅读 10.2w

AI创作

提升AI绘画质量！Midjourney关键词和参数大全

本文收集了 Midjourney 提升画面质量的关键词、参数和命令，让你产出更优质的AI绘画。

1分钟阅读

夏花生

2024/03/26

阅读 11.4w

AI创作

人人都能做音乐！Suno v3 一键生成高质量中文歌曲！

最近 Suno 推出了新的 v3 版本，不仅在质量上有了大幅提升，还支持自定义歌词，然后让 AI 生成旋律并演唱等。

8分钟阅读

{{comTitle}} {{comSubtitle}}

评论

收藏

热门频道

设计灵感

支持与服务

官方社群
优设官方微信群
01优设AIGC自学交流群
02优设小红书个人IP交流群
03优设设计师交流群
04优设UI设计师交流群
05优设交互设计师交流群
06优设电商交流群
07优设私单群

08优设硬件种草交流群
09优设同城搭子群
10优设大学生交流群
11优设插画师交流群
12优设平面品牌设计师交流群
13优设3D设计师交流群
14优设摄影剪辑爱好者交流群
微信扫码添加管理员招财

微信号：扫码添加

严格审核打造高质量交流群

进群会有面试题谢绝打广告
优设微博

@
优设AIGC
400W粉丝！每日更新设计干货
@
优设
强烈推荐！优设官方品牌微博
@
优优教程网
官方微博，海量教程看不完
@
优设基础训练营
零基础入门，带你成为软件高手
优设微信

每天官微五分钟

一年萌新变大神

扫码关注

1000W

优设新媒体矩阵等你来关注

优优教程网

优设大课堂

设计师导航