Unsicherheitsbewusste Wissens-Transformer für Peer-to-Peer-Energietrading mit Multi-Agenten-Verstärkungslernen

In dieser Arbeit wird ein neues Framework für Peer-to-Peer (P2P)-Energietrading vorgestellt, das Unsicherheitsbewusste Vorhersage mit Multi-Agenten-Verstärkungslernen (MARL) verbindet und somit eine kritische Lücke in der aktuellen Literatur schließt. Im Gegensatz zu früheren Arbeiten, die auf deterministische Vorhersagen vertrauten, verwendet der vorgeschlagene Ansatz einen heteroskedastischen probabilistischen Transformer-basierten Vorhersagemodell, das als Knowledge Transformer with Uncertainty (KTU) bezeichnet wird, um die Vorhersageunsicherheit explizit zu quantifizieren. Dies ist entscheidend für robuste Entscheidungsfindung in der stochastischen Umgebung des P2P-Energietradings. Das KTU-Modell nutzt domänenspezifische Merkmale und wird mit einer benutzerdefinierten Verlustfunktion trainiert, die zu zuverlässigen probabilistischen Vorhersagen und Konfidenzintervallen für jede Vorhersage führt. Die Integration dieser unsicherheitsbasierten Vorhersagen in das MARL-System ermöglicht es den Agenten, Handelsstrategien unter klarem Verständnis von Risiko und Variabilität zu optimieren. Experimentelle Ergebnisse zeigen, dass der unsicherheitsbasierte Deep Q-Network (DQN) die Energiekaufkosten um bis zu 5,7 % reduziert, ohne P2P-Handel, und um 3,2 % mit P2P-Handel, während gleichzeitig der Umsatz mit Stromverkäufen um 6,4 % und 44,7 % steigt. Zudem wird die Netzlast in Spitzenzeiten um 38,8 % ohne P2P-Handel und um 45,6 % mit P2P-Handel reduziert. Diese Verbesserungen sind noch stärker ausgeprägt, wenn P2P-Handel aktiviert ist, was die Synergie zwischen fortgeschrittener Vorhersage und Marktmekanismen für ressourceneffiziente und resilientere Energiegemeinschaften unterstreicht.