HyperAIHyperAI
منذ 17 أيام

AnyLoc: نحو التعرف البصري العام على المواقع

Nikhil Keetha, Avneesh Mishra, Jay Karhade, Krishna Murthy Jatavallabhula, Sebastian Scherer, Madhava Krishna, Sourav Garg
AnyLoc: نحو التعرف البصري العام على المواقع
الملخص

تمثّل التعرف البصري على المواقع (VPR) عنصرًا حاسمًا في تحديد موقع الروبوتات. حتى الآن، تمثل أكثر الطرق فعالية في VPR حلولًا مخصصة للبيئة والمهام المحددة: فبينما تُظهر أداءً قويًا في البيئات المنظمة (وخاصة في بيئات القيادة الحضرية)، ينخفض أداؤها بشكل كبير في البيئات غير المنظمة، مما يجعل معظم هذه الحلول هشة تجاه التطبيقات الواقعية الموثوقة. في هذا العمل، نطوّر حلًا عالميًا لمشكلة VPR — تقنية تعمل على نطاق واسع من البيئات المنظمة وغير المنظمة (الحضرية، الخارجية، الداخلية، الجوية، تحت الماء، والتحت الأرضية) دون الحاجة إلى إعادة تدريب أو ضبط دقيق. نُظهر أن التمثيلات المميزة العامة المستمدة من نماذج تعلم ذاتي جاهزة للإستخدام، دون أي تدريب مخصص لـ VPR، تمثل الأساس الصحيح لبناء حلول VPR عالمية. وبدمج هذه الميزات المستمدة مع تجميع غير مراقب للخصائص، نحقق بفضل مجموعة منهجياتنا، AnyLoc، أداءً يصل إلى 4 أضعاف أفضل من الحلول الحالية. كما نحقّق تحسينًا إضافيًا بنسبة 6% في الأداء من خلال تحليل الخصائص الدلالية لهذه الميزات، مما كشف عن مجالات فريدة تضم مجموعات بيانات من بيئات متشابهة. تُشكّل التجارب التفصيلية والتحليلات التي أجريناها الأساس لبناء حلول VPR يمكن نشرها في أي مكان وفي أي وقت، وبأي زاوية رؤية. نشجع القرّاء على استكشاف صفحة المشروع والتطبيقات التفاعلية لدينا: https://anyloc.github.io/.

AnyLoc: نحو التعرف البصري العام على المواقع | أحدث الأوراق البحثية | HyperAI