HyperAIHyperAI

Command Palette

Search for a command to run...

ال Transformers متعددة الآراء للفصل الدلالي في الوقت الفعلي للخريطة

Brady Zhou Philipp Krähenbühl

الملخص

نقدم نماذج الترانسفورمرات العرض المتقاطع، وهي نموذج كفؤ مبني على آلية الانتباه لتمييز الدلالة من الخرائط باستخدام كاميرات متعددة. يتعلم هندسة النموذج بشكل ضمني تحويلًا من عروض الكاميرات الفردية إلى تمثيل خريطة قياسي باستخدام آلية انتباه عرض متقاطع تدرك الكاميرا. تعتمد كل كاميرا على تضمينات موضعية تعتمد على ضبطها الذاتي والخارجي. هذه التضمينات تسمح للترانسفورمر بتعلم التحويل بين العروض المختلفة دون الحاجة إلى نمذجة هذا التحويل بشكل جغرافي صريح. يتكون الهيكل من مُشفِّر صورة تقني للتحويل لكل عرض وطبقات ترانسفورمر عرض متقاطع لاستنتاج تمييز الدلالة من الخريطة. نموذجنا بسيط، يمكن تنفيذه بالتوازي بسهولة، ويُشغل في الوقت الحقيقي. يحقق الهيكل المقدم أداءً رائدًا في مجموعة بيانات nuScenes، مع سرعات استدلال أسرع بأربع مرات. الرمز البرمجي متاح على الرابط https://github.com/bradyz/cross_view_transformers.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
ال Transformers متعددة الآراء للفصل الدلالي في الوقت الفعلي للخريطة | مستندات | HyperAI