HyperAIHyperAI
منذ 2 أشهر

BoQ: المكان يستحق حقيبة من الاستفسارات القابلة للتعلم

Ali-Bey, Amar ; Chaib-draa, Brahim ; Giguère, Philippe
BoQ: المكان يستحق حقيبة من الاستفسارات القابلة للتعلم
الملخص

في مجال التعرف على المواقع البصري، لا يزال تحديًا كبيرًا تحديد وتطابق صور المواقع تحت ظروف بيئية مختلفة وزوايا رؤية متنوعة بدقة. في هذا البحث، نقدم تقنية جديدة تُسمى "حقيبة الاستعلامات" (Bag-of-Queries - BoQ)، والتي تتعلم مجموعة من الاستعلامات العالمية المصممة لالتقاط الصفات الخاصة بالموقع بشكل عام. بخلاف الطرق الحالية التي تعتمد على الانتباه الذاتي وتولد الاستعلامات مباشرة من الخصائص الدخيلة، تعتمد تقنية BoQ على استعلامات عالمية قابلة للتعلم بشكل منفصل، والتي تستكشف الخصائص الدخيلة عبر الانتباه المتقاطع، مما يضمن جمع المعلومات بشكل متسق. بالإضافة إلى ذلك، توفر تقنيتنا آلية انتباه قابلة للتفسير وتندمج مع كلاً من هياكل الشبكات العصبية المت convoled (CNN) وهياكل متحولات الرؤية (Vision Transformers). أثبتت فعالية BoQ من خلال تجارب واسعة النطاق على 14 مقاييس كبيرة الحجم. فقد حققت نتائج أفضل باستمرار مقارنة بالتقنيات الرائدة حاليًا مثل NetVLAD، MixVPR وEigenPlaces. علاوة على ذلك، كتقنية استرجاع عالمية (مرحلية واحدة)، تتفوق BoQ على طرق الاسترجاع ذات المرحلتين مثل Patch-NetVLAD، TransVPR وR2Former، وهي أسرع بكثير وأكثر كفاءة بمراحل. يمكن الوصول إلى الكود وأوزان النموذج بشكل عام عبر الرابط التالي: https://github.com/amaralibey/Bag-of-Queries.