HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 4 أشهر

vFusedSeg3D: الحل الذي حصل على المرتبة الثالثة في مسابقة مجموعة بيانات Waymo Open 2024 للتصنيف الدلالي

{Ammad Nadeem Osama Amjad}

vFusedSeg3D: الحل الذي حصل على المرتبة الثالثة في مسابقة مجموعة بيانات Waymo Open 2024 للتصنيف الدلالي

الملخص

في هذه الدراسة الفنية، نقدم نظام VFusedSeg3D، وهو نظام مبتكر للدمج متعدد الوسائط طوّرته فريق VisionRD، يجمع بين بيانات الكاميرا وبيانات ليدار لتعزيز دقة الإدراك ثلاثي الأبعاد بشكل كبير. يستخدم VFusedSeg3D المحتوى الدلالي الغني في صور الكاميرا مع قدرة ليدار الدقيقة على قياس العمق لتكوين فهم قوي وشامل للبيئة، مما يعالج القيود المتأصلة في كل وسيلة على حدة. من خلال بنية شبكة مدروسة بعناية تُتماشى وتوحّد المعلومات في مراحل مختلفة، فإن تقنية الدمج المميزة لدينا تدمج الخصائص الهندسية المستمدة من سحابات نقاط ليدار مع الخصائص الدلالية المستمدة من صور الكاميرا. وباستخدام تقنيات متعددة الوسائط، تم تحسين الأداء بشكل ملحوظ، حيث بلغ متوسط التداخل بين التوقعات والواقع (mIoU) مستوى قياسيًا بلغ 72.46٪ على مجموعة التحقق، مقارنة بالمستوى السابق البالغ 70.51٪. يُعد VFusedSeg3D معيارًا جديدًا في دقة التجزئة ثلاثية الأبعاد، مما يجعله حلًا مثاليًا للتطبيقات التي تتطلب إدراكًا دقيقًا للبيئة.

المعايير القياسية

معيار قياسيالمنهجيةالمقاييس
3d-semantic-segmentation-on-waymo-openvFusedSeg3D
mIoU: 72.46

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp