PointRCNN: توليد اقتراحات الكائنات ثلاثية الأبعاد واكتشافها من السحابة النقطية

في هذا البحث، نقترح استخدام PointRCNN للكشف عن الأجسام ثلاثية الأبعاد من السحابة النقطية الخام. يتكون الإطار الكامل من مرحلتين: المرحلة الأولى لإنشاء اقتراحات ثلاثية الأبعاد بطريقة من الأسفل إلى الأعلى، والمرحلة الثانية لتحسين هذه الاقتراحات في الإحداثيات القانونية للحصول على نتائج الكشف النهائية. بدلاً من إنشاء الاقتراحات من صورة RGB أو تصوير السحابة النقطية بزاوية علوية أو تحويلها إلى مكعبات كما تفعل الطرق السابقة، فإن شبكتنا الفرعية في المرحلة الأولى تولد مباشرة عددًا قليلًا من اقتراحات ثلاثية الأبعاد عالية الجودة من السحابة النقطية بطريقة من الأسفل إلى الأعلى عبر تقسيم سحابة النقاط للمشهد بأكمله إلى نقاط مقدمة وخلفية. تقوم الشبكة الفرعية في المرحلة الثانية بتحويل النقاط المجمعة لكل اقتراح إلى الإحداثيات القانونية لتعلم الخصائص المكانية المحلية بشكل أفضل، والتي يتم دمجها مع الخصائص الدلالية العالمية لكل نقطة التي تم تعلمها في المرحلة الأولى لتحقيق تحسين دقيق للصناديق وتنبؤ الثقة. أظهرت التجارب الواسعة على معيار الكشف ثلاثي الأبعاد لمجموعة بيانات KITTI أن الهندسة المقترحة لدينا تتفوق على أفضل الطرق الحالية بمargins كبيرة باستخدام السحابة النقطية فقط كمدخل. يمكن الحصول على الرمز البرمجي من https://github.com/sshaoshuai/PointRCNN.