المحولات المعرفية التي تأخذ في الاعتبار عدم اليقين لتبادل الطاقة بين الأقران باستخدام التعلم التعزيزي متعدد الوكلاء

تقدم هذه المقالة إطارًا جديدًا لتبادل الطاقة بين الأقران (P2P) يدمج التنبؤات التي تأخذ في الاعتبار عدم اليقين مع التعلم التعزيزي متعدد الوكلاء (MARL)، مما يعالج فجوة حاسمة في الأدبيات الحالية. على عكس الدراسات السابقة التي تعتمد على التنبؤات اليقينية، يستخدم النهج المُقترح نموذجًا للتنبؤ يعتمد على تحويلات احتمالية (Probabilistic Transformer) يُسمى "مُحول المعرفة مع عدم اليقين" (KTU) لتحديد عدم اليقين في التنبؤ بشكل صريح، وهو أمر ضروري لاتخاذ قرارات قوية في البيئة العشوائية لتبادل الطاقة بين الأقران. يعتمد نموذج KTU على ميزات محددة بالقطاع، ويتم تدريبه باستخدام دالة خسارة مخصصة تضمن تنبؤات احتمالية موثوقة وحدود ثقة لكل تنبؤ. دمج هذه التنبؤات التي تأخذ في الاعتبار عدم اليقين في إطار MARL يسمح للوكلاء بتحسين استراتيجيات التداول مع فهم واضح للمخاطر والتنوع. أظهرت نتائج التجارب أن شبكة DQN (Deep Q-Network) التي تأخذ في الاعتبار عدم اليقين تقلل تكاليف شراء الطاقة بنسبة تصل إلى 5.7% دون تبادل P2P، وبنسبة 3.2% مع تبادل P2P، في حين تزيد دخل مبيعات الكهرباء بنسبة 6.4% و44.7% على التوالي. كما تم تقليل الطلب على الشبكة خلال ساعات الذروة بنسبة 38.8% دون تبادل P2P، وبنسبة 45.6% مع تبادل P2P. تظهر هذه التحسينات بشكل أكثر وضوحًا عندما يكون تبادل P2P مفعلًا، مما يبرز التكامل بين التنبؤات المتقدمة وآليات السوق لبناء مجتمعات طاقة مرنة وفعالة اقتصاديًا.