3 个月前

摘要

协作式多智能体规划要求智能体在信息不完全且通信受限的条件下做出联合决策。在轨迹层面进行协调常常失败，因为微小的时间或运动偏差会迅速引发冲突。符号化规划通过提升抽象层次，并提供一组最小化的动作词汇，有效缓解了这一挑战，从而实现同步与集体进展。本文提出 DR. WELL，一种用于协作式多智能体规划的去中心化神经符号框架。协作通过两阶段协商协议展开：智能体首先基于推理提出候选角色，随后在达成共识并满足环境约束的前提下，共同确定角色分配。一旦达成承诺，各智能体便独立生成并执行其角色对应的符号化计划，而无需披露具体的轨迹细节。这些计划通过一个共享的世界模型与执行结果相联系，该模型编码当前环境状态，并在智能体执行过程中持续更新。与直接处理原始轨迹不同，DR. WELL 通过对符号化计划进行推理，避免了脆弱的逐步对齐问题，从而支持可复用、可同步且可解释的高层操作。在协作推方块任务上的实验表明，智能体能够在不同回合中实现自适应调整，动态世界模型能够捕捉可复用的行为模式，显著提升任务完成率与执行效率。实验进一步显示，通过协商与自我优化，动态世界模型在付出一定时间开销的前提下，实现了协作策略的持续演化，进而提升了整体任务完成效率。

源 PDF