التعدين الصعب العالمي القائم على الوكيل للاعتراف بالمكان البصري

تعلم التمثيلات العميقة للاعتراف بالمكان البصري يتم عادةً باستخدام وظائف خسارة ثنائية أو ثلاثية تعتمد بشكل كبير على صعوبة الأمثلة التي يتم اختيارها في كل دورة تدريب. تقنيات الحفر الصعبة خارج الخط (offline hard mining) الحالية تتعامل مع هذه المشكلة من خلال استخدام حفر صعبة تتطلب حسابات وذاكرة باهظة، والتي تتكون من تحديد أصعب الأمثلة من مجموعة التدريب في كل دورة. في هذا البحث، نقدم تقنية جديدة تقوم بحفر مجموعات صغيرة عالمية بناءً على الوكلاء (proxies). لتحقيق ذلك، نضيف فرعًا قابلًا للتدريب من النهاية إلى النهاية إلى الشبكة، والذي يولد وصفات مكان فعالة (وكيل واحد لكل مكان). يتم استخدام هذه التمثيلات الوكيلة لبناء فهرس عالمي يشمل التشابه بين جميع الأماكن في مجموعة البيانات، مما يسمح بحفر مجموعات صغيرة غنية بالمعلومات في كل دورة تدريب. يمكن استخدام طريقتنا بالاشتراك مع جميع وظائف الخسارة الثنائية والثلاثية الموجودة مع زيادة طفيفة جدًا في الذاكرة والحساب. أجرينا دراسات تحليلية شاملة وأظهرنا أن تقنيتنا تحقق أداءً جديدًا رائدًا على عدة مقاييس كبيرة مثل بيتسبرغ (Pittsburgh)، مابيلي سلس (Mapillary-SLS) وسبيد (SPED). وبشكل خاص، توفر طريقتنا تحسينًا نسبيًا بنسبة أكثر من 100% على مجموعة بيانات نوردلاند (Nordland) الصعبة. شفرتنا متاحة على الرابط: https://github.com/amaralibey/GPM