HyperAIHyperAI
منذ 2 أشهر

OpenStreetView-5M: الطرق المتعددة للتَّحديد البصري الجغرافي العالمي

Guillaume Astruc; Nicolas Dufour; Ioannis Siglidis; Constantin Aronssohn; Nacim Bouia; Stephanie Fu; Romain Loiseau; Van Nguyen Nguyen; Charles Raude; Elliot Vincent; Lintao XU; Hongyu Zhou; Loic Landrieu
OpenStreetView-5M: الطرق المتعددة للتَّحديد البصري الجغرافي العالمي
الملخص

تحديد موقع صورة في أي مكان على الأرض هو مهمة بصرية معقدة، مما يجعلها ذات أهمية خاصة لتقييم خوارزميات الرؤية الحاسوبية. ومع ذلك، فإن غياب قواعد بيانات معيارية وذات نطاق كبير ومفتوحة الوصول تحتوي على صور يمكن تحديد موقعها بشكل موثوق به قد حد من إمكاناتها. لمعالجة هذه المشكلة، نقدم OpenStreetView-5M (OSV-5M)، وهي قاعدة بيانات ذات نطاق كبير ومفتوحة الوصول تتكون من أكثر من 5.1 مليون صورة شارع جغرافية المرجع، تغطي 225 دولة وإقليمًا. على عكس المعايير الموجودة، نحن نطبق فصلًا صارمًا بين البيانات التدريبية والاختبارية، مما يتيح لنا تقييم أهمية الخصائص الجغرافية المكتسبة دون مجرد حفظ المعلومات. لإثبات فائدة قاعدة بياناتنا، أجرينا دراسة مرجعية شاملة لمختلف مشفرات الصور المتقدمة وتمثيلات الفضاء واستراتيجيات التدريب. يمكن العثور على جميع الأكواد والنموذج المرتبطة بـ https://github.com/gastruc/osv5m.

OpenStreetView-5M: الطرق المتعددة للتَّحديد البصري الجغرافي العالمي | أحدث الأوراق البحثية | HyperAI