HyperAIHyperAI

غرفة_البيئة_2

RoomEnv-v2 هو بيئة معقدة متوافقة مع Gymnasium، مصممة لتحدي خوارزميات التعلم التعزيزي من خلال عملية قرار ماركوف جزئياً قابلة للملاحظة (POMDP). تستخدم هذه البيئة نظام ذاكرة بشرية معزز بالرسوم المعرفية لتحسين قدرات اتخاذ القرار للخوارزمية في سيناريوهات متعددة الغرف ديناميكية. يمكن للمستخدمين ضبط المعلمات مثل تخطيط الغرفة، عدد الأشياء، واحتمالات الانتقال لإنشاء مجموعة متنوعة من الإعدادات التجريبية، مما يتيح تقييم وتحسين استراتيجيات استكشاف وتقييم الوكيل.

غرفة_البيئة_2 | SOTA | HyperAI