CPlaNet: تحسين تحديد موقع الصور الجغرافي من خلال تقسيم الخرائط بطريقة توليفية

تحديد الموقع الجغرافي للصورة هو مهمة تحديد المكان المصور في الصورة بناءً على معلوماتها البصرية فحسب. تعد هذه المهمة تحديًا جوهريًا نظرًا لكون العديد من الصور تحتوي على مؤشرات قليلة، قد تكون غامضة، إلى موقعها الجغرافي. عمل حديث قام بتحويل هذه المهمة إلى مشكلة تصنيف من خلال تقسيم الأرض إلى مجموعة من الخلايا المنفصلة التي تتوافق مع المناطق الجغرافية. يمثل مستوى التفاصيل في هذا التقسيم تنازلًا حاسمًا؛ حيث يؤدي استخدام عدد أقل ولكن أكبر من الخلايا إلى انخفاض دقة الموقع، بينما يؤدي استخدام عدد أكبر ولكن أصغر من الخلايا إلى تقليل عدد أمثلة التدريب لكل فئة وزيادة حجم النموذج، مما يجعله عرضة للتضخيم (overfitting). لمعالجة هذه المشكلة، نقترح خوارزمية بسيطة ولكن فعالة، وهي التقسيم التركيبي (combinatorial partitioning)، والتي تولد عددًا كبيرًا من الفئات ذات التفاصيل الدقيقة عن طريق تقاطع عدة تقسيمات خشنة للأرض. يقوم كل تصنيف بالتصويت للفئات ذات التفاصيل الدقيقة التي تتداخل مع فئاتهم الخشنة الخاصة بهم. تسمح لنا هذه التقنية بتوقع المواقع بدقة عالية بينما تحافظ على وجود أمثلة كافية للتدريب لكل فئة. حققت خوارزميتنا أفضل الأداء في مجال التعرف على الموقع في عدة مجموعات بيانات مرجعية.