HyperAIHyperAI
منذ 17 أيام

نموذج ثنائي تسلسلي للمنفعة المحددة بالبيئة والمكان لتمييز المكان البصري

Nikhil Varma Keetha, Michael Milford, Sourav Garg
نموذج ثنائي تسلسلي للمنفعة المحددة بالبيئة والمكان لتمييز المكان البصري
الملخص

تسعى أساليب التعرف على المكان البصري (VPR) عادةً إلى مطابقة الأماكن من خلال تحديد المؤشرات البصرية أو مناطق الصور أو المعالم التي تمتلك "فائدة" عالية في تحديد مكان معين. لكن مفهوم الفائدة ليس مفردًا، بل يمكن أن يأخذ أشكالًا متعددة. في هذه الورقة، نقدم منهجًا جديدًا لاستخلاص نوعين رئيسيين من الفائدة لـ VPR: الفائدة الخاصة بالمؤشرات البصرية المميزة للبيئة، والفائدة الخاصة بموقع معين. نستخدم مبادئ التعلم التبايني (contrastive learning) لتقدير الفائدة الخاصة بالبيئة والمكان من خلال تجميعات متجهات التوصيفات المجمعة محليًا (VLAD) بطريقة غير مراقبة، والتي تُستخدم بعد ذلك لتوجيه مطابقة الميزات المحلية من خلال اختيار النقاط المميزة (keypoints). وبدمج هذين القياسين للفائدة، نحقق أداءً من الدرجة الأولى على ثلاث مجموعات بيانات تحدي صعبة، مع تقليل متطلبات التخزين ووقت الحساب في نفس الوقت. ونقدم تحليلًا إضافيًا يُظهر أن اختيار التجميعات غير المراقبة يؤدي إلى نتائج ذات دلالة معنوية، وأن التصنيف أكثر دقة غالبًا ما يكون له فائدة أعلى لـ VPR مقارنة بالتصنيف الدلالي عالي المستوى (مثل: مبنى، طريق)، كما نصف كيف تتغير هذان القياسان للفائدة عبر أماكن وبيئات مختلفة. تم إتاحة الشفرة المصدرية للجمهور عبر الرابط التالي: https://github.com/Nik-V9/HEAPUtil.