دورة حول العالم في 80 خطوة زمنية: نهج توليدي للتحديد البصري العالمي للموقع

التحديد الجغرافي البصري العالمي يتنبأ بموقع التقاط الصورة على سطح الأرض.نظراً لاختلاف الصور في مدى دقة تحديدها، فإن هذه المهمة تتضمن بطبيعتها درجة كبيرة من الغموض. ومع ذلك، فإن النهج الحالية هي حتمية وتجاهل هذا الجانب. في هذا البحث، نهدف إلى سد الفجوة بين طرق التحديد الجغرافي التقليدية والأساليب التوليدية الحديثة. نقترح أول نهج توليدي للتحديد الجغرافي يستند إلى الانتشار ومطابقة التدفق الريمانية، حيث يتم تنفيذ عملية إزالة الضوضاء مباشرة على سطح الأرض. يحقق نموذجنا أداءً رائدًا في ثلاثة مقاييس للتحديد الجغرافي البصري: OpenStreetView-5M (مقياس OpenStreetView-5M)، YFCC-100M (مقياس YFCC-100M)، وiNat21 (مقياس iNat21). بالإضافة إلى ذلك، نقدم مهمة التحديد الجغرافي البصري الاحتمالي، حيث يقوم النموذج بتنبؤ توزيع احتمالي فوق جميع المواقع المحتملة بدلاً من نقطة واحدة. نقدم مقاييس وأسس جديدة لهذه المهمة، مما يظهر مزايا نهجنا المستند إلى الانتشار. سيتم جعل الأكواد والنماذج متاحة.请注意,为了确保专业术语的准确性,我在某些地方保留了英文标注。如果您需要进一步调整或有其他要求,请告知。