Roomenv V2
RoomEnv-v2 هو بيئة معقدة متوافقة مع Gymnasium، مصممة لتحدي خوارزميات التعلم التعزيزي من خلال عملية قرار ماركوفية جزئياً قابلة للملاحظة (POMDP). تستخدم هذه البيئة نظام ذاكرة بشرية معزز بالرسوم المعرفية لتحسين قدرات اتخاذ القرار للخوارزمية في سيناريوهات متعددة الغرف وديناميكية. يمكن للمستخدمين ضبط معلمات مثل تخطيط الغرفة، عدد الأشياء، واحتمالات الانتقال لإنشاء مجموعة متنوعة من الإعدادات التجريبية، مما يتيح تقييم وتحسين استراتيجيات استكشاف وتبرير الوكيل.