HyperAIHyperAI
منذ 17 أيام

تحسين اللوحة — الكشف الموضعي عن الكائنات ثلاثية الأبعاد

Johannes Lehner, Andreas Mitterecker, Thomas Adler, Markus Hofmarcher, Bernhard Nessler, Sepp Hochreiter
تحسين اللوحة — الكشف الموضعي عن الكائنات ثلاثية الأبعاد
الملخص

نُقدّم نموذجًا ثنائي المراحل يُسمى "تحسين القطعة" (Patch Refinement)، مُصممًا للكشف الدقيق والتحديد المكاني للكائنات ثلاثية الأبعاد من بيانات السحابة النقطية. يتكون نموذج Patch Refinement من شبكتين تعتمدان على VoxelNet ومدربتين بشكل مستقل: شبكة اقتراح المناطق (RPN) وشبكة التحسين المحلي (LRN). قمنا بتفكيك مهمة الكشف إلى خطوتين: خطوة أولية للكشف في منظور الطيارة (Bird’s Eye View - BEV)، تليها خطوة كشف ثلاثية الأبعاد محلية. استنادًا إلى المواقع المُقترحة في منظور BEV من قبل RPN، نستخرج مجموعات صغيرة من السحابة النقطية (تسمى "قطعًا" أو "patches")، والتي تُعالج بعدها بواسطة LRN. وبما أن كل قطعة صغيرة الحجم، فإن LRN لا تتأثر بشدة بقيود الذاكرة، ما يمكّننا من استخدام ترميز بحلقة مكعبات (voxel resolution) أعلى محليًا. كما أن استقلالية LRN تتيح لنا استخدام تقنيات إثراء إضافية، وتمكّن من تدريب فعّال مركّز على الانحدار، نظرًا لاستخدام جزء صغير جدًا من كل مشهد. عند تقييم النموذج على معيار كشف الكائنات ثلاثية الأبعاد في KITTI، تفوقت مشاركتنا المُقدّمة في 28 يناير 2019 على جميع المشاركات السابقة في جميع ثلاث صعوبات فئة السيارة، باستخدام فقط 50٪ من بيانات التدريب المتاحة، وباستخدام معلومات الليدار فقط.