HyperAIHyperAI
منذ 2 أشهر

CV-Cities: تقدمة للتَّحديد الجغرافي عبر وجهات النظر المتعددة في المدن العالمية

Huang, Gaoshuang ; Zhou, Yang ; Zhao, Luying ; Gan, Wenjian
CV-Cities: تقدمة للتَّحديد الجغرافي عبر وجهات النظر المتعددة في المدن العالمية
الملخص

التحديد الجغرافي عبر وجهات النظر المتقاطعة (CVGL)، والذي يشمل مطابقة واسترجاع الصور الفضائية لتحديد الموقع الجغرافي للصورة الأرضية، يعد أمرًا حاسمًا في السيناريوهات التي تواجه قيودًا في نظام تحديد المواقع العالمي القائم على الأقمار الصناعية (GNSS). ومع ذلك، فإن هذه المهمة تواجه تحديات كبيرة بسبب الاختلافات الكبيرة في وجهات النظر، وتعقيد سيناريوهات التحديد، والاحتياج إلى التحديد العالمي. لمعالجة هذه المشكلات، نقترح إطار عمل جديد لـ CVGL يدمج نموذج الأساس البصري DINOv2 مع خلطان متقدم للخصائص. يقدم إطار العمل الخاص بنا خسارة InfoNCE المتماثلة ويضم استراتيجيات عينة الجيران القريبين وعينة التشابه الديناميكية، مما يعزز بشكل كبير دقة التحديد. تظهر النتائج التجريبية أن الإطار العمل الخاص بنا يتفوق على الطرق الموجودة في عدة مجموعات بيانات عامة ومبنية ذاتيًا. لتحسين الأداء على نطاق عالمي بشكل أكبر، طورنا CV-Cities، وهو مجموعة بيانات جديدة لمهمة CVGL العالمية. تتضمن CV-Cities 223,736 زوج من الصور الأرضية-الفضائية مع بيانات الموقع الجغرافي، وتغطي ستة عشر مدينة عبر ست قارات وتشمل مجموعة واسعة من السيناريوهات المعقدة، مما يوفر معيارًا صعبًا لـ CVGL. يظهر الإطار العمل الذي تم تدريبه باستخدام CV-Cities دقة تحديد عالية في مدن اختبار مختلفة، مما يؤكد قدراته القوية على العولمة والتعميم. يمكن الوصول إلى مجموعات البيانات والأكواد الخاصة بنا عبر الرابط https://github.com/GaoShuang98/CVCities.

CV-Cities: تقدمة للتَّحديد الجغرافي عبر وجهات النظر المتعددة في المدن العالمية | أحدث الأوراق البحثية | HyperAI