Command Palette
Search for a command to run...
NEXUS:一种用于时间序列预测的智能体框架
NEXUS:一种用于时间序列预测的智能体框架
Sarkar Snigdha Sarathi Das Palash Goyal Mihir Parmar Nanyun Peng Vishy Tirumalasetty Chun-Liang Li Rui Zhang Jinsung Yoon Tomas Pfister
摘要
时间序列预测不仅仅是数值的线性外推,通常还需要结合新闻或事件等非结构化上下文数据进行推理。尽管专门的时间序列基础模型(TSFMs)擅长基于数值模式进行预测,但它们无法感知现实世界中的文本信号。相反,虽然大型语言模型(LLMs)正逐渐成为零样本预测器的有力候选者,但其性能在不同领域和语境归因方面仍存在显著差异。为填补这一空白,我们引入了 NEXUS,这是一种多智能体预测框架。该框架将预测过程分解为多个专业化阶段:首先隔离宏观层面的时间波动和微观层面的时间波动,并在可用时整合上下文信息,最后合成最终预测结果。这种分解机制使得 NEXUS 能够适应从季节性信号到波动性、事件驱动信息的各种场景,而无需依赖外部统计锚点或单一的全局提示(prompting)。我们的研究表明,当前一代的大型语言模型(LLMs)具备比此前认知更强的内在预测能力,但这严重取决于数值推理与上下文推理的组织方式。在严格晚于大型语言模型(LLMs)知识截止日期的数据上进行的评估显示,涵盖 Zillow 房地产指标和波动剧烈的股票市场股票,NEXUS 始终表现持平或优于最先进的 TSFM 以及强大的 LLM 基线模型。除了数值准确性外,NEXUS 还能生成高质量的推理轨迹(reasoning traces),明确展示每个预测背后的根本驱动因素。我们的结果确立了一个观点:现实世界的预测本质上是一个智能体推理(agentic reasoning)问题,其范畴远不止于序列建模。
一句话总结
作者介绍了 NEXUS,这是一个多 Agent 框架,它将时间序列预测分解为宏观层面和微观层面的时间波动及情境整合,以适应波动的事件驱动信息,而无需外部统计锚点。该框架在严格位于 LLM 知识截止日期之后的数据上(涵盖 Zillow 房地产指标和波动股票市场股票)的表现与最先进 TSFM 和强 LLM 基线相匹配或更优,同时生成推理轨迹,明确显示每个预测背后的基本驱动因素。
核心贡献
- 本文介绍了 NEXUS,这是一个多 Agent 预测框架,它将预测分解为专门阶段,以在整合情境信息之前隔离宏观和微观波动。这种分解使得从季节性信号到波动、事件驱动信息的适应成为可能,而无需依赖外部统计锚点或单体提示。
- 在严格位于 LLM 知识截止日期之后的数据上评估,涵盖 Zillow 房地产指标和波动股票市场股票,NEXUS 始终与最先进 TSFM 和强 LLM 基线相匹配或更优。这些发现表明,当数值和情境推理得到有效组织时,当前一代 LLM 具有比之前认识到的更强的内在预测能力。
- 除了数值准确性之外,该框架还生成高质量的推理轨迹,明确显示每个预测背后的基本驱动因素。此输出表明,现实世界的预测是一个 Agent 推理问题,远远超出了仅序列建模的范围。
引言
高风险领域的时间序列预测需要合成数值模式与未结构化的情境信号,如新闻或经济事件。现有的时间序列基础模型擅长捕捉季节性趋势,但在多模态真空中运行,忽略了结构性断裂的定性驱动因素。同时,大型语言模型可以解析文本情境,但缺乏精确数值模式识别所需的内在自回归机制。作者介绍了 NEXUS,这是一个多 Agent 框架,它将预测分解为专门阶段,以隔离宏观层面波动和微观层面事件催化剂。通过在合成最终预测之前整合情境信息并采用领域级校准循环,这种方法使 LLM 能够利用更强的内在预测能力。该系统在波动股票和房地产数据集上始终优于最先进的基础模型,同时为每个预测生成可解释的推理轨迹。
方法
NEXUS 框架通过将预测任务分解为整合多模态情境与严格时间序列推理的多 Agent 系统,解决了现有方法的局限性。与缺乏可解释性和情境的传统时间序列基础模型 (TSFMs) 或通常无法准确捕捉时间序列属性的基于 LLM 的预测不同,NEXUS 利用专门架构生成稳健的数值预测和明确的推理。请参阅下图中的框架图,以对这些范式进行高层比较。
作者将 NEXUS 框架结构化为三个不同的逻辑阶段:情境化、双分辨率预测展望生成、以及预测合成与校准。这种系统分解允许模型处理原始多模态数据,跨不同分辨率投影未来展望,并最终将这些视角合成为最终预测。此多 Agent 系统的详细工作流程如下图所示。
阶段 1:情境化 为防止认知过载并确保模型在长序列中跟踪关键信息,该框架采用历史情境 Agent (Actx)。该 Agent 充当映射函数 Actx(X1:τ,E1:τ)→H1:τ,将原始多模态情境和基本时间序列特征转换为高度结构化的时间线 H1:τ。对于每个时间步 t,该 Agent 分析数值 xt 以及外部文本信息 et,以识别驱动变化的最重要因素。Actx 不生成通用摘要,而是构建一个逐步列表,其中每个元素 ht∈H1:τ 明确将值与关键驱动因素的简洁摘要链接起来。此过程过滤掉噪声,并确保下游 Agent 接收高保真的因果关系信号。
阶段 2:双分辨率预测展望生成 稳健的预测需要跨多个时间分辨率分析时间序列,以平衡总体趋势与短期波动。NEXUS 从结构化历史 H1:τ 生成两个互补的展望。宏观推理 Agent (Amacro) 采用自上而下的方法,为整个预测范围 T 绘制出广泛轨迹。形式上,它充当映射 Amacro(H1:τ)→(Xτ+1:τ+Tmacro,Rmacro),建立预期机制并确保预测与根本性转变保持一致。相反,微观推理 Agent (Amicro) 采用细粒度方法,评估每个未来时间步 t∈[τ+1,τ+T] 的即时催化剂和局部波动。它为每个步骤输出特定推理 rtmicro 和相应数值 xtmicro,确保对即时事件的响应能力。
阶段 3:预测合成与校准 最后阶段合并双重视角,并通过校准循环优化策略。预测合成器 Agent (Asyn) 通过动态评估和合并宏观和微观视角来计算最终预测。它根据学习指南 G 的条件,将结构化历史与双重展望合成,充当映射 Asyn(H1:τ,Xmacro,Rmacro,Xmicro,Rmicro,G)→(Xτ+1:τ+T,R)。为了适应不同领域而无需手动指令设计,该框架在前向模拟回测机制中采用校准 Agent (Acalib)。历史数据被划分为 n 个顺序分割,其中 Agent 分析训练折叠中的预测误差以生成批判规则 Gi。这些规则相交以产生稳健的主指南 G=⋂i=1n−1Gi,并在隐藏集上进行验证,以确保它们在不发生过拟合的情况下提高性能。
实验
NEXUS 框架在模型知识截止日期后策划的真实世界数据集上接受了严格的零样本评估,以防止数据泄露,并与专门的时间序列和思维链基线进行性能比较。实验结果表明,NEXUS 在多模态情境和纯数值预测中始终优于这些基线,同时表现出更优越的逻辑连贯性和推理质量。此外,组件分析证实,宏观、微观和校准 Agent 的整合对于捕捉时间动态和实现最佳准确性至关重要。
作者执行组件分析,通过将完整管道与消融变体进行比较,以量化 NEXUS 框架内不同 Agent 的影响。结果表明,禁用微观推理、宏观推理或校准 Agent 始终会导致 Zillow 房地产和股票市场数据集上的预测误差更高。移除微观推理 Agent 会增加错误率,表明其对于捕捉细粒度短期波动是必要的。宏观推理 Agent 的缺失导致消融变体中的最高错误率,突显了其对于总体趋势指导的重要性。完整 NEXUS 管道始终实现最低误差指标,证实了合成宏观和微观视角与校准对于最佳性能是必要的。
作者将 NEXUS 框架与 TimesFM-2.5 和 Chain-of-Thought 基线在 Zillow 房地产和股票市场数据集上进行比较。结果表明,NEXUS 在短、中、长期范围内始终产生最低的预测误差。相比之下,CoT 基线经常表现出最高的错误率,特别是在 Zillow 领域。与 TimesFM-2.5 和 CoT 基线相比,NEXUS 在 Zillow 和股票市场数据集上始终实现最低错误率。CoT 基线表现出最高的错误率,特别是在 Zillow 房地产领域和更长的预测范围内。NEXUS 表现出一致的稳定性,与其他评估方法相比,实现了最低的 MAPE 和 RMSE 平均值。
作者在房地产和股票市场数据集上评估 NEXUS 框架与 TimesFM-2.5 和 Chain-of-Thought 基线。结果表明,NEXUS 在短、中、长期范围内始终实现最低的预测误差,显著优于基线。这种优越性在房地产数据集中尤为明显,其中基线模型难以应对复杂动态。NEXUS 在几乎所有类别中实现最低误差指标,在表中以绿色阴影突出显示。Chain-of-Thought 基线表现出显著更高的误差,特别是在 Zillow 房地产数据集中,其中标记为红色。该框架在短期和长期预测范围内均保持相对于基线的持续性能改进。
作者在 Zillow 房地产和股票市场数据集上评估 NEXUS 框架与 Chain-of-Thought 基线进行时间序列预测。结果显示,与基线相比,NEXUS 在所有预测范围内始终实现更低的错误率。性能差距在 Zillow 房地产数据集中明显更大,其中该框架在相对和绝对误差指标中均表现出更高的准确性。NEXUS 在所有预测范围内始终优于 Chain-of-Thought 基线。该框架在 Zillow 房地产数据集的误差减少方面实现了显著更高的相对改进。对于平均绝对百分比误差和均方根误差指标,均保持了优越性能。
作者在 Zillow 房地产和股票市场数据集上评估 NEXUS 框架与 Chain-of-Thought 基线进行多模态情境时间序列预测。结果表明,NEXUS 在短、中、长预测范围内通常优于基线,其中在 Zillow 房地产领域观察到最显著的增益。虽然基线在长期股票市场预测上表现出竞争性性能,但 NEXUS 框架在两个数据集上实现了更优越的整体平均准确性。NEXUS 在房地产和股票市场数据集上的平均错误率均低于 CoT 基线。该框架在 Zillow 房地产领域显示出特别强的改进,显著降低了百分比和幅度误差。虽然基线在长期股票市场预测上表现具有竞争力,但 NEXUS 框架在所有其他测试范围内保持稳健性能。
评估通过组件分析以及与 TimesFM-2.5 和 Chain-of-Thought 等基线在 Zillow 房地产和股票市场数据集上的比较来评估 NEXUS 框架。消融研究表明,移除任何 Agent 都会增加预测误差,突显了整合微观和宏观推理与校准对于最佳性能的必要性。因此,完整 NEXUS 管道在所有预测范围内始终实现比竞争方法更低的错误率和更大的稳定性,其中在房地产领域观察到特别显著的增益。