3 天前

Lauri Lovén Alaa Saleh Reza Farahani Ilir Murturi Miguel Bordallo López Praveen Kumar Donta Schahram Dustdar

摘要

实时人工智能（AI）服务日益运行于“设备 - 边缘 - 云”连续体中。在此环境中，自主 AI 智能体生成对延迟敏感的工作负载，编排多阶段处理流水线，并在策略与治理约束下竞争共享资源。本文表明，服务依赖图的结构——建模为有向无环图（DAG），其中节点代表计算阶段，边编码执行顺序——是决定去中心化、基于价格的资源分配能否在大规模场景下可靠运行的首要因素。当依赖图呈现层次化结构（如树状或串并联结构）时，价格能够收敛至稳定均衡，最优分配可被高效计算；在适当的机制设计下（采用拟线性效用与离散切片资源），智能体在每个决策周期内均无动机虚报其估值。然而，当依赖关系更为复杂、流水线阶段之间存在交叉耦合时，价格会出现振荡，分配质量下降，系统管理难度显著增加。为弥合这一差距，我们提出一种混合管理架构：跨域集成器将复杂子图封装为资源切片，从而向市场其他部分呈现更简洁、结构良好的接口。通过涵盖六个实验（共 1,620 次运行，每次实验使用 10 个随机种子）的系统性消融研究，我们证实：（i）依赖图拓扑结构是价格稳定性与可扩展性的首要决定因素；（ii）该混合架构可将价格波动降低 70%–75%，同时不牺牲吞吐量；（iii）治理约束会引致可量化的效率 - 合规性权衡，该权衡 jointly 依赖于拓扑结构与系统负载；（iv）在诚实竞价条件下，去中心化市场可达到与集中式价值最优基准相当的分配质量，从而验证了去中心化协调能够复现集中式分配的性能。

一句话总结

来自奥卢大学及其他欧洲机构的作者提出了一种混合管理架构，该架构将复杂的服务依赖关系封装为多面体切片（polymatroidal slices），从而在设备 - 边缘 - 云连续体上为实时 AI 代理实现稳定且激励相容的去中心化资源分配。

主要贡献

当复杂的服务依赖图产生跨资源互补性，导致价格无法收敛且分配效率低下时，跨越设备 - 边缘 - 云连续体的实时 AI 服务将面临不稳定性。
所提出的混合管理架构将复杂的子图封装为资源切片，以强制实施分层拓扑结构，确保可行分配集形成多面体（polymatroid），从而保证市场出清价格和真实出价。
在 1,620 次运行中进行的系统性消融研究表明，该方法在不过牺牲吞吐量的情况下，将价格波动降低了高达 75%，并且在真实出价条件下，其价值最优质量与集中式基线相当。

引言

实时 AI 服务越来越多地在设备 - 边缘 - 云环境中运行，自主代理必须在严格的管理约束下协调对延迟敏感的工作负载。先前的方法难以应对，因为跨信任边界的集中式编排并不切实际，而简单的去中心化市场在复杂的服务依赖关系导致资源互补性、使价格失稳并使最优分配在计算上不可行时会失效。作者利用服务依赖图拓扑来识别稳定机制，其中树状或串并联结构能保证市场均衡和真实出价，随后提出了一种混合架构，将复杂的子图封装为简化的资源切片，从而在不牺牲吞吐量的情况下恢复稳定性。

方法

作者提出了一个分布式服务计算框架，其中自主 AI 代理生成任务、组合服务，并在设备、边缘平台和云基础设施的连续体上进行经济交互。系统在离散时间步 $t$ 中运行，代理根据公认的系统状态 $s_t$ 调整其估值。整体模型整合了代理行为、资源依赖、治理约束和机制设计，以促进高效分配。

请参阅框架图以概览系统组件及其交互。流程始于代理层（Agentic Layer），在此代理发出任务 $T_i(t)$ 并发送消息 $m_i(t)$ 。这些输入流入估值层（Valuation Layer），该层计算延迟感知的估值，定义为 $V_{ik}(T_{ik}, q_{ik}) = v_{ik}(q_k) \delta_{ik}(T_{ik})$ 。其中， $v_{ik}(q)$ 表示以质量 $q$ 完成任务的基础价值，而 $\delta_{ik}$ 捕捉延迟衰减。估值取决于与任务相关的延迟 $T_{ik}$ 和工作负载 $q_k$ 。

同时，服务层（Service Layer）定义可用容量 $C(t)$ ，而依赖 DAG将资源间的结构依赖建模为 $G_{res} = (R, E)$ 。这些因素汇聚于可行集（Feasible Set），即资源约束 $X_{res}$ 与治理约束 $X_{gov}$ 的交集。治理输入，包括信任分数 $\phi(t)$ 和策略 $G(t)$ ，进一步限制了可行分配。随后，机制（Mechanism） $M$ 将消息和当前状态映射为分配 $x_t$ 和支付 $P_i(t)$ 。最后，**状态更新（State Update）**模块根据 $s_{t+1} = \Psi(s_t, x_t, P(t), \xi_t)$ 演化系统状态，纳入外生事件和已实现的分配。

为了确保在存在复杂依赖关系时的可解性，作者引入了一种混合市场架构。如下图所示，该架构由三个主要层级组成：跨域集成器、本地市场和 AI 代理。

跨域集成器（Cross-Domain Integrators） 构成了面向代理的层级。每个集成器将复杂的多资源服务路径封装为符合治理规范的切片。在内部，集成器管理其子系统的依赖 DAG，并暴露一个简化的、可替代的容量接口。该切片的容量被设定为内部子 DAG 的最大流。这种封装吸收了原本会破坏基于市场的协调稳定性的互补性。

在集成器之下，本地市场（Local Marketplaces） 在设备或边缘范围内运行，以协调可替代的服务和资源，如计算周期和带宽。这些市场通过轻量级拍卖或挂牌价格进行出清，并执行本地治理策略。对于简单的单域服务，代理可以直接与本地市场交互。市场间协调（Inter-Market Coordination） 通过交换粗粒度信号（如总需求和拥塞指标）来确保一致性，而无需进行全系统优化。

机制设计依赖于可行分配集的结构属性。作者证明，当服务依赖 DAG 是树状或串并联网络时，容量约束形成多面体。通过架构封装，集成器确保代理所见的商图（quotient graph）保持这种树状或串并联结构，即使底层基础设施 DAG 是任意的。这保留了面向代理的可行区域的多面体结构。

此外，在切片封装下，延迟感知的估值满足粗替代品（gross-substitutes, GS）条件。这是因为集成器在每个机制周期内暴露离散的、不可分割的切片，具有固定的内部路由和确定性延迟。结合多面体可行集和 GS 估值，系统承认瓦尔拉斯均衡（Walrasian equilibrium）。因此，高效分配可以通过递增拍卖在多项式时间内计算，并且结果可以使用 VCG 或多面体成交拍卖（polymatroid clinching auctions）等机制以占优策略激励相容（DSIC）的方式实施。

实验

结构纪律实验验证了多面体拓扑（树状和线性）能确保市场稳定性，价格波动为零，而纠缠的依赖图在高负载下会导致严重退化和市场失效。
混合架构实验证实，将复杂服务封装为切片可显著降低价格波动，其中 EMA 平滑是主要的稳定因素，而效率因子则在拥塞状态下改善了延迟和福利。
治理实验表明，严格的信任门控容量划分通过降低延迟，以牺牲服务覆盖率为代价换取了质量，但由于资源池较小，它可能会在原本稳定的拓扑中引发价格波动。
交互研究表明，混合架构有效缓解了严格治理引入的波动惩罚，协同效应因拓扑结构而异，从加性到超加性不等。
市场机制实验显示，在真实出价下，基于价格的协调产生的福利结果与价值贪婪分配几乎相同，表明该机制的主要价值在于激励对齐而非信息优势。

源 PDF

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

3 天前

Lauri Lovén Alaa Saleh Reza Farahani Ilir Murturi Miguel Bordallo López Praveen Kumar Donta Schahram Dustdar

摘要

一句话总结

主要贡献

当复杂的服务依赖图产生跨资源互补性，导致价格无法收敛且分配效率低下时，跨越设备 - 边缘 - 云连续体的实时 AI 服务将面临不稳定性。
所提出的混合管理架构将复杂的子图封装为资源切片，以强制实施分层拓扑结构，确保可行分配集形成多面体（polymatroid），从而保证市场出清价格和真实出价。
在 1,620 次运行中进行的系统性消融研究表明，该方法在不过牺牲吞吐量的情况下，将价格波动降低了高达 75%，并且在真实出价条件下，其价值最优质量与集中式基线相当。

引言

方法

实验

结构纪律实验验证了多面体拓扑（树状和线性）能确保市场稳定性，价格波动为零，而纠缠的依赖图在高负载下会导致严重退化和市场失效。
混合架构实验证实，将复杂服务封装为切片可显著降低价格波动，其中 EMA 平滑是主要的稳定因素，而效率因子则在拥塞状态下改善了延迟和福利。
治理实验表明，严格的信任门控容量划分通过降低延迟，以牺牲服务覆盖率为代价换取了质量，但由于资源池较小，它可能会在原本稳定的拓扑中引发价格波动。
交互研究表明，混合架构有效缓解了严格治理引入的波动惩罚，协同效应因拓扑结构而异，从加性到超加性不等。
市场机制实验显示，在真实出价下，基于价格的协调产生的福利结果与价值贪婪分配几乎相同，表明该机制的主要价值在于激励对齐而非信息优势。

源 PDF

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

实时人工智能服务经济：跨连续体的代理计算框架

Lauri Lovén Alaa Saleh Reza Farahani Ilir Murturi Miguel Bordallo López Praveen Kumar Donta Schahram Dustdar

摘要

一句话总结

主要贡献

引言

方法

实验

用 AI 构建 AI

HyperAI Newsletters

Command Palette

实时人工智能服务经济：跨连续体的代理计算框架

Lauri Lovén Alaa Saleh Reza Farahani Ilir Murturi Miguel Bordallo López Praveen Kumar Donta Schahram Dustdar

摘要

一句话总结

主要贡献

引言

方法

实验

用 AI 构建 AI

HyperAI Newsletters

Command Palette

实时人工智能服务经济：跨连续体的代理计算框架

Lauri Lovén Alaa Saleh Reza Farahani Ilir Murturi Miguel Bordallo López Praveen Kumar Donta Schahram Dustdar

摘要

一句话总结

主要贡献

引言

方法

实验

用 AI 构建 AI

HyperAI Newsletters