OpenStreetView-5M: الطرق المتعددة للتَّحديد البصري الجغرافي العالمي

تحديد موقع صورة في أي مكان على الأرض هو مهمة بصرية معقدة، مما يجعلها ذات أهمية خاصة لتقييم خوارزميات الرؤية الحاسوبية. ومع ذلك، فإن غياب قواعد بيانات معيارية وذات نطاق كبير ومفتوحة الوصول تحتوي على صور يمكن تحديد موقعها بشكل موثوق به قد حد من إمكاناتها. لمعالجة هذه المشكلة، نقدم OpenStreetView-5M (OSV-5M)، وهي قاعدة بيانات ذات نطاق كبير ومفتوحة الوصول تتكون من أكثر من 5.1 مليون صورة شارع جغرافية المرجع، تغطي 225 دولة وإقليمًا. على عكس المعايير الموجودة، نحن نطبق فصلًا صارمًا بين البيانات التدريبية والاختبارية، مما يتيح لنا تقييم أهمية الخصائص الجغرافية المكتسبة دون مجرد حفظ المعلومات. لإثبات فائدة قاعدة بياناتنا، أجرينا دراسة مرجعية شاملة لمختلف مشفرات الصور المتقدمة وتمثيلات الفضاء واستراتيجيات التدريب. يمكن العثور على جميع الأكواد والنموذج المرتبطة بـ https://github.com/gastruc/osv5m.