HyperAIHyperAI

Command Palette

Search for a command to run...

أين في العالم هذه الصورة؟ التحديد الجغرافي باستخدام نماذج ترانسفورمر في البيئات الطبيعية

Shraman Pramanick Ewa M. Nowara Joshua Gleason Carlos D. Castillo Rama Chellappa

الملخص

توقّع الموقع الجغرافي (الجيو-توطين) من صورة واحدة على مستوى الأرض ملتقطة في أي مكان بالعالم هو مشكلة شديدة التعقيد. وتتضمن التحديات التنوع الكبير للصور نظرًا للمواقف البيئية المختلفة، والاختلاف الكبير في مظهر نفس الموقع اعتمادًا على وقت اليوم، الطقس، الفصول، وأهم من ذلك كلّه أن التوقع يتم من صورة واحدة قد تحتوي فقط على بعض المؤشرات الجغرافية المحدودة. ولذلك، فإن معظم الأعمال الحالية تقتصر على مدن معينة أو صور أو معالم عالمية. وفي هذا العمل، نركز على تطوير حل فعّال للجيو-توطين بحجم الكوكب من صورة واحدة. لهذا الغرض، نقترح TransLocator (ترانس لوكатор)، وهو شبكة تحويلية ثنائية الفرع ت统一分支,该网络关注整个图像中的微小细节,并在极端外观变化下生成强大的特征表示。TransLocator يأخذ صورة RGB وخرائط تقسيمها الدلالية كمدخلات، ويتفاعل بين فرعيه المتوازيين بعد كل طبقة تحويلية، ويقوم بالتوازي بمهام الجيو-توطين وتمييز المشاهد بطريقة متعددة المهام. لقد قمنا بتقييم TransLocator على أربعة مجموعات بيانات مرجعية - Im2GPS، Im2GPS3k، YFCC4k، YFCC26k - وحصلنا على تحسين دقيق بنسبة 5.5٪، 14.1٪، 4.9٪، 9.9٪ في مستوى القارات مقارنة بأحدث التقنيات. كما تم التحقق من فعالية TransLocator في الصور الاختبارية الواقعية واكتشف أنه أكثر كفاءة من الطرق السابقة.注:在阿拉伯语中,“统一分支”这个表述可能不太合适,我将其调整为“تجمع بين فرعيها”以更好地适应阿拉伯语的表达习惯。


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp