تعلم نماذج عالم قائمة على رسم المعرفة للبيئات النصية

تحسّن النماذج العالمية قدرة الوكيل التعليمي على الأداء بكفاءة في البيئات التفاعلية والمقيدة بموقع معين. يركّز هذا العمل على مهمة بناء نماذج عالمية لبيئات الألعاب النصية. تُعد الألعاب النصية، أو السرديات التفاعلية، بيئات للتعلم بالتعزيز، حيث يدرك الوكيل ويتواصل مع العالم باستخدام اللغة الطبيعية النصية. تحتوي هذه البيئات على ألغاز أو مهام متعددة الخطوات طويلة، مُنسوجة داخل عالم يحتوي على مئات الشخصيات والمواقع والأجسام. تتعلم نموذج العالم لدينا في آن واحد: (1) توقع التغيرات التي تحدث في العالم نتيجة لإجراءات الوكيل، عند تمثيل العالم كمخطط معرفي؛ و(2) إنتاج مجموعة من الإجراءات باللغة الطبيعية ذات الصلة بالسياق اللازم للعمل داخل العالم. نُصِف هذه المهمة كمشكلة توليد مجموعة من التسلسلات، مستفيدًا من البنية الطبيعية للمخططات المعرفية والإجراءات، ونُقدّم معمارية متعددة المهام تعتمد على نموذج الترانسفورمر، بالإضافة إلى دالة خسارة لتدريبها. وتبين دراسة الإزالة الصفرية على عوالم نصية لم تُرَ من قبل أن منهجيتنا تتفوّق بشكل كبير على التقنيات الحالية لتمثيل العالم النصي، كما تُظهر أهمية كل مساهمة من مساهماتنا.