إعادة النظر في IM2GPS في عصر التعلم العميق

تحديد موقع الصورة الجغرافي، وهو استنتاج الموقع الجغرافي لصورة ما، يعد مشكلة صعبة في مجال رؤية الحاسوب ذات تطبيقات محتملة عديدة. النهج الأكثر تقدماً حديثاً لهذه المشكلة هو نهج تصنيف الصور العميق، حيث يتم تقسيم العالم إلى خلايا فضائية وتدريب شبكة عميقة على التنبؤ بالخلية الصحيحة لصورة معينة. نقترح دمج هذا النهج مع النهج الأصلي Im2GPS، حيث يتم مطابقة صورة الاستفسار مع قاعدة بيانات تحتوي على صور مرتبطة بمواقع جغرافية وتحديد الموقع من مجموعة الصور المسترجعة. نقدر الموقع الجغرافي لصورة الاستفسار من خلال تطبيق تقدير الكثافة النواتي على مواقع أقرب جيرانها في قاعدة البيانات المرجعية. بشكل مثير للإعجاب، نجد أن أفضل الخصائص لمهمتنا في الاسترجاع تأتي من الشبكات التي تم تدريبها باستخدام خسارة التصنيف رغم عدم استخدامنا نهج التصنيف أثناء الاختبار. يتفوق التدريب باستخدام خسارة التصنيف على عدة طرق لتعلم الخصائص العميقة (مثل شبكات سيامي مع خسارة مقارنة أو ثلاثية) التي تكون أكثر شيوعًا في التطبيقات الاسترجاعية. يحقق نهجانا البسيط دقة تحديد المواقع الجغرافية الأعلى بينما يتطلب أيضًا كمية أقل بكثير من بيانات التدريب.