通过生成式人工智能增强多智能体强化学习实现低空无人机救援任务分配与探索优化
Xin Tang, Qian Chen, Wenjie Weng, Chao Jin, Zhang Liu, Jiacheng Wang, Geng Sun, Xiaohuan Li, Dusit Niyato
发布日期: 4/22/2025

摘要
人工智能 (AI) 驱动的卷积神经网络可增强低空无人驾驶飞行器 (UAV) 和地面计算节点 (GCN) 在未知环境中执行的救援、检查和监视任务。然而,它们的高计算需求通常超出单个 UAV 的能力,导致系统不稳定,而 GCN 有限且动态的资源进一步加剧了这种情况。为了应对这些挑战,本文提出了一种新颖的协作框架,涉及 UAV、地面嵌入式机器人 (GER) 和高空平台 (HAP),该框架通过 UAV 到 GER (U2G) 和 UAV 到 HAP (U2H) 通信实现资源池化,为 UAV 卸载的任务提供计算服务。具体而言,我们将 UAV 中的任务分配和探索优化的多目标优化问题表述为动态长期优化问题。我们的目标是在确保系统长期稳定性的同时,最大限度地减少任务完成时间和能耗。为了实现这一目标,我们首先采用 Lyapunov 优化技术将具有稳定性约束的原始问题转换为每时隙确定性问题。然后,我们提出了一种名为 HG-MADDPG 的算法,该算法将匈牙利算法与基于生成扩散模型 (GDM) 的多智能体深度确定性策略梯度 (MADDPG) 方法相结合。我们首先引入匈牙利算法作为探索区域选择的方法,提高无人机与环境交互的效率。然后,我们创新地将 GDM 和多智能体深度确定性策略梯度 (MADDPG) 结合起来,以优化任务分配决策,例如任务卸载和资源分配。仿真结果证明了所提方法的有效性,与基准方法相比,任务卸载效率、延迟减少和系统稳定性均有显着提高。