
摘要
本文提出了一种新的框架,用于集成不确定性感知预测与多智能体强化学习(MARL)的点对点(P2P)能源交易,填补了当前文献中的一个关键空白。与以往依赖确定性预测的工作不同,本研究提出的方法采用了一种称为具有不确定性的知识变换器(Knowledge Transformer with Uncertainty, KTU)的异方差概率变换器预测模型,明确量化了预测不确定性,这对于在P2P能源交易的随机环境中进行稳健决策至关重要。KTU模型利用特定领域的特征,并通过自定义损失函数进行训练,以确保每个预测的可靠概率预报和置信区间。将这些不确定性感知的预测结果整合到MARL框架中,使智能体能够在充分了解风险和变化的情况下优化交易策略。实验结果显示,启用不确定性感知的深度Q网络(Deep Q-Network, DQN)在没有P2P交易的情况下可降低高达5.7%的购电成本,在有P2P交易的情况下可降低3.2%的购电成本;同时分别提高了6.4%和44.7%的售电收入。此外,在没有P2P交易的情况下,高峰时段电网需求降低了38.8%,而在有P2P交易的情况下则降低了45.6%。当启用P2P交易时,这些改进更为显著,突显了先进预测与市场机制之间的协同作用,有助于构建更具韧性和经济效率的能源社区。