المهام المساعدة والاستكشاف تمكّن الملاحة بين الأشياء (ObjectNav)

الملاحة الموجهة إلى الأهداف (ObjectNav) هي مهمة ملموسة تتمثل في قيام الوكلاء بالتنقل نحو كائن معين في بيئة غير معروفة. أظهرت الدراسات السابقة أن الوكلاء الذين يقومون بالملاحة من النهاية إلى النهاية باستخدام وحدات بصرية وتكرارية تقليدية، مثل CNN+RNN، يحققون أداءً ضعيفًا بسبب التكيف الزائد وعدم كفاءة العينات. هذا الأمر دفع الطرق الحالية الأكثر تقدمًا إلى خلط المكونات التحليلية والتعلمية وتشغيلها على خرائط فضائية صريحة للبيئة. بدلاً من ذلك، نعيد تمكين وكيل تعلم عام بإضافة مهام تعلم مساعدة ومكافأة استكشافية. حقق وكيلانا نسبة نجاح بلغت 24.5% ونسبة SPL (Success Weighted by Path Length) بلغت 8.1%, مما يمثل تحسينًا نسبيًا بنسبة 37% و8% على التوالي مقارنة بأحدث الأساليب السابقة في تحدي Habitat ObjectNav. بناءً على تحليلنا، نقترح أن الوكلاء سيقومون بتقديم إدخالاتهم البصرية بشكل مبسط لتسهيل حركيات RNN الخاصة بهم، وأن المهام المساعدة تقلل من التكيف الزائد عن طريق تقليل البعد الفعال لـ RNN؛ أي أن وكيل ObjectNav الفعال الذي يجب عليه الحفاظ على خطط متماسكة على مدى طويل يقوم بذلك من خلال تعلم حركيات متكررة سلسة ومنخفضة البعد. الموقع: https://joel99.github.io/objectnav/