HyperAI

AmbiK: مجموعة مهام غامضة في بيئة المطبخ

Anastasiia Ivanova, Eva Bakaeva, Zoya Volovikova, Alexey K. Kovalev, Aleksandr I. Panov
تاريخ النشر: 6/5/2025
AmbiK: مجموعة مهام غامضة في بيئة المطبخ
الملخص

كجزء من وكيل مادي، يتم استخدام النماذج اللغوية الكبيرة (LLMs) عادةً للتخطيط للسلوك بناءً على تعليمات اللغة الطبيعية من المستخدم. ومع ذلك، فإن التعامل مع التعليمات الغامضة في البيئات الحقيقية لا يزال تحديًا للنماذج اللغوية الكبيرة. تم اقتراح العديد من الطرق للكشف عن غموض المهام. ومع ذلك، من الصعب مقارنتها لأنها تُختبر على مجموعات بيانات مختلفة وليس هناك مقاييس عالمية. لهذا السبب، نقترح مجموعة البيانات النصية الكاملة AmbiK (المهام الغامضة في بيئة المطبخ)، والتي تتضمن تعليمات غامضة موجهة إلى روبوت في بيئة المطبخ. تم جمع AmbiK بمساعدة النماذج اللغوية الكبيرة وتم التحقق منها بواسطة البشر. تتكون من 1000 زوج من المهام الغامضة ونظيراتها الواضحة، مرتبة حسب نوع الغموض (التفضيلات البشرية، المعرفة الشائعة، السلامة)، مع وصف للبيئة، أسئلة توضيحية وأجوبتها، نوايا المستخدم، وخطة المهمة، بإجمالي 2000 مهمة. نأمل أن تمكن AmbiK الباحثين من إجراء مقارنة موحدة لطرق الكشف عن الغموض. يمكن الوصول إلى AmbiK عبر الرابط https://github.com/cog-model/AmbiK-dataset.