HyperAIHyperAI
منذ شهر واحد

CogDDN: الملاحة المستندة إلى الطلب المعرفي مع تحسين القرار وتفكير العمليتين

Yuehao Huang, Liang Liu, Shuangming Lei, Yukai Ma, Hao Su, Jianbiao Mei, Pengxiang Zhao, Yaqing Gu, Yong Liu, Jiajun Lv
CogDDN: الملاحة المستندة إلى الطلب المعرفي مع تحسين القرار وتفكير العمليتين
الملخص

الروبوتات المتنقلة مطلوبة بشكل متزايد للتنقل والتفاعل في بيئات غير معروفة وغير منظمة لتلبية احتياجات البشر. يمكّن التنقل القائم على الطلب (DDN) الروبوتات من تحديد وتحديد مواقع الأشياء بناءً على النوايا الضمنية للإنسان، حتى عندما تكون مواقع هذه الأشياء غير معروفة. ومع ذلك، تعتمد الأساليب التقليدية القائمة على البيانات لـ DDN على بيانات مجمعة مسبقًا لتدريب النماذج واتخاذ القرارات، مما يحد من قدرتها على التعميم في السيناريوهات غير المعروفة. في هذا البحث، نقترح CogDDN، وهو إطار يستند إلى نماذج اللغة المرئية (VLM) يحاكي آليات الإدراك والتعلم البشرية من خلال دمج أنظمة التفكير السريع والبطيء واختياريًا تحديد الأشياء الرئيسية اللازمة لتلبية طلبات المستخدم. يقوم CogDDN بتحديد الأهداف المناسبة عن طريق تطابق الدلالات بين الأشياء المكتشفة والتعليمات المعطاة. بالإضافة إلى ذلك، يدمج وحدة اتخاذ القرار ثنائية العملية، تتكون من عملية تقديرية لقرارات سريعة وكفؤة وعملية تحليلية تحلل الأخطاء السابقة وتراكمها في قاعدة معرفية وتحسن الأداء بشكل مستمر. تعزز عملية التفكير المتسلسل (CoT) عملية اتخاذ القرار. أظهرت التقييمات المغلقة الشاملة على المحاكي AI2Thor باستخدام مجموعة بيانات ProcThor أن CogDDN يتفوق على الأساليب التي تعتمد فقط على الكاميرا بمقدار 15%، مما يدل على تحسين كبير في دقة التنقل والمرونة. يمكن الوصول إلى صفحة المشروع عبر هذا الرابط: https://thishttpsURL.com