HyperAIHyperAI

Command Palette

Search for a command to run...

BEVStereo: تحسين تقدير العمق في كشف الكائنات ثلاثية الأبعاد متعدد الرؤى باستخدام الاستereo الزمني الديناميكي

Yinhao Li Han Bao Zheng Ge Jinrong Yang Jianjian Sun Zeming Li

الملخص

محدودة بالغموض المتأصّل في إدراك العمق، تواجه الطرق الحديثة للكشف عن الأجسام ثلاثية الأبعاد المستندة إلى الكاميرات حافة أداء مُعَرَّضة للانسداد. بشكلٍ طبيعي، يُعدّ استخدام تقنية الرؤية الثلاثية عبر المشاهد المتعددة عبر الزمن (MVS) المعرفة الطبيعية للتعامل مع هذا الغموض. ومع ذلك، فإن المحاولات التقليدية لتقنية MVS تعاني من عيوب في جوانبَ اثنتين عند تطبيقها في سيناريوهات الكشف عن الأجسام ثلاثية الأبعاد: 1) يعاني قياس التماسك بين جميع المشاهد من تكاليف حسابية باهظة؛ 2) يصعب التعامل مع السيناريوهات الخارجية التي تكون فيها الأجسام غالبًا متحركة. ولحل هذه المشكلة، نُقدّم طريقةً فعّالةً للرؤية ثلاثية الأبعاد عبر الزمن، تُمكّن من اختيار مقياس مطابقة مرشّحات ديناميكيًا، مما يُقلّل بشكل كبير من عبء الحوسبة. ونذهب أبعد من ذلك، حيث نصمم خوارزمية تكرارية لتحديث المرشّحات الأكثر قيمة، مما يجعلها قادرة على التكيّف مع المرشّحات المتحركة. ونُطبّق الطريقة المقترحة في مُكتشف 3D متعدد المشاهد، ونُسمّيها BEVStereo. تحقق BEVStereo أداءً جديدًا على مستوى الحالة الحالية (أي 52.5% mAP و61.0% NDS) في المسار المُعتمد فقط على الكاميرات في مجموعة بيانات nuScenes. وفي الوقت نفسه، تُظهر التجارب الواسعة أن طريقةً لدينا تتفوّق على الطرق الحديثة المستندة إلى MVS في التعامل مع السيناريوهات الخارجية المعقدة. تم إصدار الشيفرة المصدرية على الرابط: https://github.com/Megvii-BaseDetection/BEVStereo.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp