HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 4 أشهر

تعلم إعادة تحديد الموضع متعدد المقاطع باستخدام الشبكات العصبية الرسومية

{ Junqiu Wang Shaojun Cai Xin Wu Fei Xue}

تعلم إعادة تحديد الموضع متعدد المقاطع باستخدام الشبكات العصبية الرسومية

الملخص

نُقترح بناء رسم بياني للوجه (View Graph) لاستخراج المعلومات الواردة في التسلسل الكامل المعطى بهدف تقدير وضعية الكاميرا المطلقة. بشكل محدد، نستعين بشبكات الرسوم البيانية العصبية (GNNs) لتمثيل هذا الرسم البياني، مما يسمح للاطارات غير المتتالية بالتبادل المعلومات فيما بينها. بدلًا من استخدام شبكات GNN التقليدية مباشرة، نعيد تعريف العقد، والحواف، والوظائف المُدمجة لتتناسب مع مهمة إعادة التحديد المكاني. وتعمل شبكات GNN المُعاد تصميمها بالتعاون مع شبكات التعلم العميق التلافيفي (CNNs) على التوجيه في انتقال المعرفة واستخراج الميزات على التوالي، لمعالجة ميزات الصور متعددة الرؤى عالية الأبعاد بشكل تكراري على مستويات مختلفة. بالإضافة إلى ذلك، نستخدم دالة خسارة قائمة على الرسم البياني بشكل عام، تتجاوز القيود المفروضة بين الرؤى المتتالية، لتدريب الشبكة بطريقة متكاملة (end-to-end). أظهرت التجارب الواسعة التي أُجريت على مجموعات بيانات داخلية وخارجية أن طريقتنا تتفوق على الأساليب السابقة، خاصة في السيناريوهات الكبيرة والصعبة.

المعايير القياسية

معيار قياسيالمنهجيةالمقاييس
camera-localization-on-oxford-robotcar-fullGNNMapNet
Mean Translation Error: 17.35
visual-localization-on-oxford-robotcar-fullGNNMapNet
Mean Translation Error: 17.35

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp