HyperAIHyperAI
منذ 2 أشهر

أين في العالم هذه الصورة؟ التحديد الجغرافي باستخدام نماذج ترانسفورمر في البيئات الطبيعية

Shraman Pramanick; Ewa M. Nowara; Joshua Gleason; Carlos D. Castillo; Rama Chellappa
أين في العالم هذه الصورة؟ التحديد الجغرافي باستخدام نماذج ترانسفورمر في البيئات الطبيعية
الملخص

توقّع الموقع الجغرافي (الجيو-توطين) من صورة واحدة على مستوى الأرض ملتقطة في أي مكان بالعالم هو مشكلة شديدة التعقيد. وتتضمن التحديات التنوع الكبير للصور نظرًا للمواقف البيئية المختلفة، والاختلاف الكبير في مظهر نفس الموقع اعتمادًا على وقت اليوم، الطقس، الفصول، وأهم من ذلك كلّه أن التوقع يتم من صورة واحدة قد تحتوي فقط على بعض المؤشرات الجغرافية المحدودة. ولذلك، فإن معظم الأعمال الحالية تقتصر على مدن معينة أو صور أو معالم عالمية. وفي هذا العمل، نركز على تطوير حل فعّال للجيو-توطين بحجم الكوكب من صورة واحدة. لهذا الغرض، نقترح TransLocator (ترانس لوكатор)، وهو شبكة تحويلية ثنائية الفرع ت统一分支,该网络关注整个图像中的微小细节,并在极端外观变化下生成强大的特征表示。TransLocator يأخذ صورة RGB وخرائط تقسيمها الدلالية كمدخلات، ويتفاعل بين فرعيه المتوازيين بعد كل طبقة تحويلية، ويقوم بالتوازي بمهام الجيو-توطين وتمييز المشاهد بطريقة متعددة المهام. لقد قمنا بتقييم TransLocator على أربعة مجموعات بيانات مرجعية - Im2GPS، Im2GPS3k، YFCC4k، YFCC26k - وحصلنا على تحسين دقيق بنسبة 5.5٪، 14.1٪، 4.9٪، 9.9٪ في مستوى القارات مقارنة بأحدث التقنيات. كما تم التحقق من فعالية TransLocator في الصور الاختبارية الواقعية واكتشف أنه أكثر كفاءة من الطرق السابقة.注:在阿拉伯语中,“统一分支”这个表述可能不太合适,我将其调整为“تجمع بين فرعيها”以更好地适应阿拉伯语的表达习惯。

أين في العالم هذه الصورة؟ التحديد الجغرافي باستخدام نماذج ترانسفورمر في البيئات الطبيعية | أحدث الأوراق البحثية | HyperAI