HyperAIHyperAI

Command Palette

Search for a command to run...

实时人工智能服务经济:跨连续体的代理计算框架

Lauri Lovén Alaa Saleh Reza Farahani Ilir Murturi Miguel Bordallo López Praveen Kumar Donta Schahram Dustdar

摘要

实时人工智能(AI)服务日益运行于“设备 - 边缘 - 云”连续体中。在此环境中,自主 AI 智能体生成对延迟敏感的工作负载,编排多阶段处理流水线,并在策略与治理约束下竞争共享资源。本文表明,服务依赖图的结构——建模为有向无环图(DAG),其中节点代表计算阶段,边编码执行顺序——是决定去中心化、基于价格的资源分配能否在大规模场景下可靠运行的首要因素。当依赖图呈现层次化结构(如树状或串并联结构)时,价格能够收敛至稳定均衡,最优分配可被高效计算;在适当的机制设计下(采用拟线性效用与离散切片资源),智能体在每个决策周期内均无动机虚报其估值。然而,当依赖关系更为复杂、流水线阶段之间存在交叉耦合时,价格会出现振荡,分配质量下降,系统管理难度显著增加。为弥合这一差距,我们提出一种混合管理架构:跨域集成器将复杂子图封装为资源切片,从而向市场其他部分呈现更简洁、结构良好的接口。通过涵盖六个实验(共 1,620 次运行,每次实验使用 10 个随机种子)的系统性消融研究,我们证实:(i)依赖图拓扑结构是价格稳定性与可扩展性的首要决定因素;(ii)该混合架构可将价格波动降低 70%–75%,同时不牺牲吞吐量;(iii)治理约束会引致可量化的效率 - 合规性权衡,该权衡 jointly 依赖于拓扑结构与系统负载;(iv)在诚实竞价条件下,去中心化市场可达到与集中式价值最优基准相当的分配质量,从而验证了去中心化协调能够复现集中式分配的性能。

一句话总结

来自奥卢大学及其他欧洲机构的作者提出了一种混合管理架构,该架构将复杂的服务依赖关系封装为多面体切片(polymatroidal slices),从而在设备 - 边缘 - 云连续体上为实时 AI 代理实现稳定且激励相容的去中心化资源分配。

主要贡献

  • 当复杂的服务依赖图产生跨资源互补性,导致价格无法收敛且分配效率低下时,跨越设备 - 边缘 - 云连续体的实时 AI 服务将面临不稳定性。
  • 所提出的混合管理架构将复杂的子图封装为资源切片,以强制实施分层拓扑结构,确保可行分配集形成多面体(polymatroid),从而保证市场出清价格和真实出价。
  • 在 1,620 次运行中进行的系统性消融研究表明,该方法在不过牺牲吞吐量的情况下,将价格波动降低了高达 75%,并且在真实出价条件下,其价值最优质量与集中式基线相当。

引言

实时 AI 服务越来越多地在设备 - 边缘 - 云环境中运行,自主代理必须在严格的管理约束下协调对延迟敏感的工作负载。先前的方法难以应对,因为跨信任边界的集中式编排并不切实际,而简单的去中心化市场在复杂的服务依赖关系导致资源互补性、使价格失稳并使最优分配在计算上不可行时会失效。作者利用服务依赖图拓扑来识别稳定机制,其中树状或串并联结构能保证市场均衡和真实出价,随后提出了一种混合架构,将复杂的子图封装为简化的资源切片,从而在不牺牲吞吐量的情况下恢复稳定性。

方法

作者提出了一个分布式服务计算框架,其中自主 AI 代理生成任务、组合服务,并在设备、边缘平台和云基础设施的连续体上进行经济交互。系统在离散时间步 ttt 中运行,代理根据公认的系统状态 sts_tst 调整其估值。整体模型整合了代理行为、资源依赖、治理约束和机制设计,以促进高效分配。

请参阅框架图以概览系统组件及其交互。流程始于代理层(Agentic Layer),在此代理发出任务 Ti(t)T_i(t)Ti(t) 并发送消息 mi(t)m_i(t)mi(t)。这些输入流入估值层(Valuation Layer),该层计算延迟感知的估值,定义为 Vik(Tik,qik)=vik(qk)δik(Tik)V_{ik}(T_{ik}, q_{ik}) = v_{ik}(q_k) \delta_{ik}(T_{ik})Vik(Tik,qik)=vik(qk)δik(Tik)。其中,vik(q)v_{ik}(q)vik(q) 表示以质量 qqq 完成任务的基础价值,而 δik\delta_{ik}δik 捕捉延迟衰减。估值取决于与任务相关的延迟 TikT_{ik}Tik 和工作负载 qkq_kqk

同时,服务层(Service Layer)定义可用容量 C(t)C(t)C(t),而依赖 DAG将资源间的结构依赖建模为 Gres=(R,E)G_{res} = (R, E)Gres=(R,E)。这些因素汇聚于可行集(Feasible Set),即资源约束 XresX_{res}Xres 与治理约束 XgovX_{gov}Xgov 的交集。治理输入,包括信任分数 ϕ(t)\phi(t)ϕ(t) 和策略 G(t)G(t)G(t),进一步限制了可行分配。随后,机制(Mechanism) MMM 将消息和当前状态映射为分配 xtx_txt 和支付 Pi(t)P_i(t)Pi(t)。最后,**状态更新(State Update)**模块根据 st+1=Ψ(st,xt,P(t),ξt)s_{t+1} = \Psi(s_t, x_t, P(t), \xi_t)st+1=Ψ(st,xt,P(t),ξt) 演化系统状态,纳入外生事件和已实现的分配。

为了确保在存在复杂依赖关系时的可解性,作者引入了一种混合市场架构。如下图所示,该架构由三个主要层级组成:跨域集成器、本地市场和 AI 代理。

跨域集成器(Cross-Domain Integrators) 构成了面向代理的层级。每个集成器将复杂的多资源服务路径封装为符合治理规范的切片。在内部,集成器管理其子系统的依赖 DAG,并暴露一个简化的、可替代的容量接口。该切片的容量被设定为内部子 DAG 的最大流。这种封装吸收了原本会破坏基于市场的协调稳定性的互补性。

在集成器之下,本地市场(Local Marketplaces) 在设备或边缘范围内运行,以协调可替代的服务和资源,如计算周期和带宽。这些市场通过轻量级拍卖或挂牌价格进行出清,并执行本地治理策略。对于简单的单域服务,代理可以直接与本地市场交互。市场间协调(Inter-Market Coordination) 通过交换粗粒度信号(如总需求和拥塞指标)来确保一致性,而无需进行全系统优化。

机制设计依赖于可行分配集的结构属性。作者证明,当服务依赖 DAG 是树状或串并联网络时,容量约束形成多面体。通过架构封装,集成器确保代理所见的商图(quotient graph)保持这种树状或串并联结构,即使底层基础设施 DAG 是任意的。这保留了面向代理的可行区域的多面体结构。

此外,在切片封装下,延迟感知的估值满足粗替代品(gross-substitutes, GS)条件。这是因为集成器在每个机制周期内暴露离散的、不可分割的切片,具有固定的内部路由和确定性延迟。结合多面体可行集和 GS 估值,系统承认瓦尔拉斯均衡(Walrasian equilibrium)。因此,高效分配可以通过递增拍卖在多项式时间内计算,并且结果可以使用 VCG 或多面体成交拍卖(polymatroid clinching auctions)等机制以占优策略激励相容(DSIC)的方式实施。

实验

  • 结构纪律实验验证了多面体拓扑(树状和线性)能确保市场稳定性,价格波动为零,而纠缠的依赖图在高负载下会导致严重退化和市场失效。
  • 混合架构实验证实,将复杂服务封装为切片可显著降低价格波动,其中 EMA 平滑是主要的稳定因素,而效率因子则在拥塞状态下改善了延迟和福利。
  • 治理实验表明,严格的信任门控容量划分通过降低延迟,以牺牲服务覆盖率为代价换取了质量,但由于资源池较小,它可能会在原本稳定的拓扑中引发价格波动。
  • 交互研究表明,混合架构有效缓解了严格治理引入的波动惩罚,协同效应因拓扑结构而异,从加性到超加性不等。
  • 市场机制实验显示,在真实出价下,基于价格的协调产生的福利结果与价值贪婪分配几乎相同,表明该机制的主要价值在于激励对齐而非信息优势。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供