HyperAIHyperAI
منذ 15 أيام

ترانس جيو: الترانسفورمر هو كل ما تحتاجه لتحديد المواقع الجغرافية للصور من زوايا مختلفة

Sijie Zhu, Mubarak Shah, Chen Chen
ترانس جيو: الترانسفورمر هو كل ما تحتاجه لتحديد المواقع الجغرافية للصور من زوايا مختلفة
الملخص

تُعتمد الطرق المهيمنة القائمة على الشبكات العصبية التلافيفية (CNN) لتحديد الموقع الجغرافي للصور عبر زوايا مختلفة على التحويل القطبي، وتفشل في نمذجة الارتباط العالمي. نقترح منهجًا يعتمد بالكامل على المُحَوِّل (Transformer) يُسمى TransGeo لمعالجة هذه القيود من منظور مختلف. يتمثل TransGeo في الاستفادة الكاملة من مزايا المُحَوِّل فيما يتعلق بنمذجة المعلومات العالمية وترميز المعلومات المكانية الصريحة. كما نستفيد من مرونة إدخال المُحَوِّل، ونُقدِّم طريقة قص غير متساوية مُوجَّهة بالانتباه، بحيث تُزَال المناطق غير المفيدة في الصورة مع انخفاض ضئيل جدًا في الأداء، مما يقلل من تكلفة الحساب. ويمكن إعادة تخصيص الحوسبة المُوفرة لزيادة الدقة فقط في المناطق المفيدة، مما يؤدي إلى تحسين الأداء دون أي تكلفة حسابية إضافية. تشبه هذه الاستراتيجية "الانتباه والتكبير" السلوك البشري عند ملاحظة الصور. وبشكل ملحوظ، يحقق TransGeo نتائج رائدة على كلا مجموعة البيانات الحضرية والريفية، مع تكلفة حسابية أقل بشكل كبير مقارنة بالطرق القائمة على الشبكات العصبية التلافيفية. ولا يعتمد على التحويل القطبي، ويُقدِّم التنبؤ بسرعة أكبر من الطرق القائمة على الشبكات العصبية التلافيفية. يُمكن الوصول إلى الكود من خلال: https://github.com/Jeff-Zilence/TransGeo2022.

ترانس جيو: الترانسفورمر هو كل ما تحتاجه لتحديد المواقع الجغرافية للصور من زوايا مختلفة | أحدث الأوراق البحثية | HyperAI