Command Palette
Search for a command to run...
基础协议:面向 Agent 社会的协调层
基础协议:面向 Agent 社会的协调层
摘要
标题:(无)摘要:自主智能体正从工具转变为一种社会基础设施层:它们进行浏览、购买、部署软件、管理系统,并越来越多地相互交互。随着这些系统的规模化,瓶颈已从原始模型能力转向协调。智能体需要建立可靠的关系,组织多智能体工作,交换价值,支持人工智能经济,并在现实世界的监督下保持安全与可问责性。本文提出基础协议(Foundation Protocol, FP),这是一个面向新兴人机社会的“图优先”协调层。FP 统一了异构实体,包括智能体(agents)、工具、资源、人类、机构和组织,并支持原生的多方组织与基于事件的协作。它还提供了用于计量、收据和结算的经济原语,并将策略、溯源和审计视为一等公民。FP 旨在封装并桥接现有协议,而非取代它们,从而在降低集成与治理开销的同时实现渐进式采用。其目标是在保持自主智能体(agents)可组合性的同时,确保问责性不可妥协,从而使协调本身成为开放、多元且可治理的人机社会的共享基础设施。
一句话总结
作者提出了基础协议(Foundation Protocol,FP),这是一个以图为核心的协调层,通过原生的多方组织、基于事件的协作以及用于计量、收据和结算的经济原语,统一了 Agent、工具、资源和机构。同时,该协议通过桥接现有协议,将策略、溯源和审计提升为第一等关注点,并确保可组合且可问责的人机协作。
核心贡献
- 本文提出了基础协议(FP),这是一个以图为核心的协调层,将 Agent、工具、人类和机构统一为单一的操作底层。该架构标准化了实体、会话和事件追踪,以实现跨协议互操作以及跨多样化 Agent 工作流的原生多方协作。
- FP 提供了与账本无关的经济原语和策略执行机制,将计量、结算和溯源追踪视为协议的一等特性。这些组件实现了可审计的交易和合规执行,无需依赖特定的支付通道或应用程序特定的治理工具。
- 该架构将稳定的核心与配置、扩展和桥接解耦,以方便与 MCP、A2A 和 A2UI 等现有标准并行进行增量采用。这种模块化设计降低了集成和治理开销,同时保留了大规模人机协作的可问责性。
引言
自主 Agent 正从孤立的工具转变为混合人机社会中持续存在的参与者,它们在此环境中委托权限、交换价值并跨越组织边界运行。这一演变将主要瓶颈从模型能力转移到协调层面,使得强大的互操作性和治理成为启用安全、可扩展的经济与社会工作流的关键。现有的协议如 MCP、A2A 和 UCP 解决了特定的交互问题,但在应用于复杂、跨领域任务时会导致严重的碎片化。这种孤岛式的生态会导致语义漂移、破坏溯源链条并产生拼凑式的监督,最终迫使系统陷入高昂的自定义集成或脆弱且难以审计的架构中。作者提出了基础协议,这是一个图原生协调层,将 Agent、工具、资源和人类建模为统一结构中的可寻址实体。该协议引入了用于多方组织、基于事件的协作以及账本无关经济结算的一等原语,同时将策略执行和可审计性直接嵌入通信底层。通过设计协议以包装并桥接现有标准,作者促进了增量采用,并确保自主 Agent 能力保持可组合性而不牺牲可问责性。
数据集
- 数据集构成与来源:作者编译了在 AI 公司场景下由策略决策生成的结构化生命周期追踪记录。这些记录来源于审核员批准、创始人部署授权、支付检查点预算决策以及系统拒绝的消息。
- 各子集的关键细节:数据集按事件日志组织,以捕获每个决策点。溯源记录将每个事件与其治理策略和支持证据绑定,形成一条连续的证据链,用于追踪操作所有权、策略上下文、经济结果以及任何被覆盖的访问控制决策。
- 模型中的用途:作者利用这些追踪记录构建防篡改的审计轨迹。该数据支持执行缺席方的事后检查,支持与 GPU 供应商等外部提供商的高效争议解决,并展示了实体与信任平面以及监管与监督平面如何协同工作。
- 处理与元数据构建:记录通过信封签名进行安全保护以确保防篡改。处理流水线提取策略执行点和争议信号以维护统一的审计日志,允许用户查询完整的决策历史,而无需从分散的日志中重建状态。
方法
基础协议(FP)采用图原生架构,将 Agent 系统概念化为由关系(边)连接的实体(节点)网络,交互表示为图上的活动。这一视角支撑了基于平面的设计,该设计隔离了核心协议语义并使扩展点明确化。架构由四个主要平面组成:实体与信任平面、传输与路由平面、交互与组织平面以及监管与监督平面,以及一个将核心与具体实现绑定的配置与规格层。每个平面处理图的不同结构方面:实体与信任平面为参与者建立身份、能力和信任信号;传输与路由平面管理寻址、发现和跨多样化通信通道的消息传递;交互与组织平面定义了协作的原语,包括会话、事件和经济交易;监管与监督平面提供策略执行、审计和争议解决的机制。这些平面被设计为保持稳定,同时通过规格和扩展允许在传输、身份和领域特定模式上的可变性。该框架确保协调原语在异构系统中保持一致,从而实现自主 Agent、工具、服务和人类之间可扩展且可审计的交互。
FP 的核心语义由七个对象的最小词汇表定义:Entity、Session、Activity、Envelope、Event、Receipt/Settlement 和 Provenance。该词汇表有意保持通用性,使协议能够表达广泛的交互类型,涵盖工具调用、多 Agent 协作、组织工作流和电子商务,同时在更高层模式演进时保持稳定。Entity 对象代表任何可寻址的参与者,如人类、agent、工具或组织,其特征包括身份、能力、信任信号和隐私约束。Session 对象是多方协作的显式容器,绑定参与者、角色、策略和可选预算,从而使群体交互清晰可查且可执行。Activity 对象捕获会话内发生的事件和流,提供排序、关联和背压,使系统能够在扩展时保持可观测性。Envelope 对象标准化消息传递,通过签名和加密保持消息的完整性和机密性。Receipt 和 Settlement 对象代表经济原语,如按量计量、收据和结算引用,实现可审计的价值交换,无需强制指定特定的支付通道。Provenance 对象捕获治理交互的证据和策略决策,确保关键决策可追溯且可由第三方验证。这种一致的词汇表确保协议内的交互保持一致且可互操作,不受底层实现的影响。
实体与信任平面构成协议的基础,为所有可寻址参与者提供统一模型。每个实体通过全局唯一地址进行标识,并暴露四个关键信息:身份(标识符、密钥、版本控制)、能力(能力声明)、信任信号(证明、声誉)和隐私控制(权限、所有权)。为最小化开销,FP 采用渐进式披露机制,能力声明起初仅为包含目的、风险标签、模式哈希或价格提示的简短摘要,仅在选中或授权时获取完整详情。此方法减少了 token 的使用,并避免了将大型工具规范过早复制到模型工作上下文的常见做法。实体身份是可问责性的基本单位,允许组织作为拥有独立密钥和策略的实体进行表示,并将成员资格建模为具有作用域委托的一等边。协议不规定特定的身份方案,支持 DIDs、WebPKI 或企业系统,但明确基本结构以便其他平面依赖它。信任通过证明、质押和声誉提供者的钩子进行处理,使部署能够从本地信任开始,并逐渐跨领域互操作,而无需将信任决策简化为临时应用程序逻辑。
传输与路由平面被设计为传输无关的,定义了消息传递必须保留的内容,如寻址、发现、通道设置和终止,而不选择底层传输方式。此设计确保了对网络栈和部署环境变化的弹性,涵盖从本地 IPC 到 Web 原生传输和长期运行的异步通道。路由是关键组件,因为 Agent 交互很少保持点对点;一个群体会话可能同时跨越多种传输方式,例如指向工具的本机 IPC、指向远程 agent 的 HTTP 以及指向用户界面的 SSE。FP 将传输视为一致寻址和追踪层之下的绑定,允许消息在不同通道间移动,同时保留排序、背压、终止语义以及连贯的交互记录。这对于从少数协作 agent 扩展到大型网络和组织而不丢失可观测性至关重要。协议的配置与规格层通过规格、注册表、模式库和桥接,将核心语义绑定到具体传输、身份方法和部署环境,从而实现增量采用而非破坏性迁移。
交互与组织平面提供了多方协作的原语。模式定义消息和编解码器的结构,而事件和流提供排序、关联、重放和背压,形成由 agent、操作员、用户界面和审计员可观测的追踪层。会话和组织将群体、角色和委托作为一等对象进行捕获,使群体交互清晰可查且可执行。会话是一个显式容器,绑定参与者、角色、策略引用和可选预算,例如支出限制或 token 上限。这明确了拍卖中的竞标者、受监管工作流中的审核员以及管道中的工具提供商均表示为会话内的角色,而非应用程序特定的特例。经济原语标准化了计量、收据、结算引用和争议信号,使价值交换可审计而无需强制指定特定的支付通道。若无背压,缓慢的消费者将必须以与快速消费者相同的速度处理每个事件,这要么导致数据不完整,要么因成本过高而无法跟进。FP 在保持协作可观测性的同时,未强制要求每个参与者以相同方式消费流。
监管与监督平面将安全性视为协议层面的关注点,而非应用程序的附带考虑。它为策略评估、执行决策、审计与溯源记录、监控信号、合规钩子和争议升级提供了统一位置。这与新兴的经济现实相符:随着自主系统的扩展,验证和可问责性成为稀缺资源,而能够产生低成本证据的系统将更容易部署、治理和获得信任。关键决策可在协议边界进行检查,例如在调用或结算之前,生成的证据可由第三方验证而无需暴露敏感负载。监督平面有意与任何单一组织解耦,支持在本地运行策略、将检查委托给合规服务或向外部审计员或监管机构提供证据的策略部署。策略和溯源记录可以独立于其治理的负载进行引用、哈希和验证,使审计具备可移植性。相同的交互追踪可以在不同策略下进行检查,而无需重放交互。监督还涵盖故障情况,争议、撤销和安全报告作为一等事件,允许网络通过显式通道传播与信任相关的信息,而非依赖非正式警告、私有日志或提示词级约定。
配置与规格层的设计旨在通过明确可变性来保持协议核心的小型与稳定。规格将核心语义绑定到具体传输、身份方法和部署环境,而注册表发布模式与事件类型目录。模式库描述了可复用的多方交互模板,如拍卖、工作流和议价,桥接器则将现有生态系统适配到 FP 的信封、追踪、策略和证据模型中。这种分离明确了 FP 内部应包含的内容及其外围部分:核心定义了必须跨领域工作的对象和交互语义,而规格选择网络格式和传输绑定,扩展添加事件类型或交互模式,桥接器将外部协议映射到 FP 活动中。此边界保持实现轻量化,并帮助协议避免成为单体,从而支持围绕现有系统进行增量采用。
