HyperAIHyperAI
منذ 2 أشهر

شبكة R-CNN

Gkioxari, Georgia ; Malik, Jitendra ; Johnson, Justin
شبكة R-CNN
الملخص

التطورات السريعة في الإدراك ثنائي الأبعاد أدت إلى تطوير أنظمة قادرة على اكتشاف الأجسام بدقة في الصور الحقيقية. ومع ذلك، فإن هذه الأنظمة تقوم بالتنبؤات ثنائية الأبعاد، مما يجعلها تتجاهل البنية ثلاثية الأبعاد للعالم. وفي الوقت نفسه، ركزت التطورات في مجال التنبؤ بالأشكال ثلاثية الأبعاد بشكل أساسي على مقاييس البناء الاصطناعي والأشياء المنعزلة. نحن نوحّد التقدم في هذين المجالين. نقترح نظامًا يكتشف الأجسام في الصور الحقيقية ويُنتج شبكة مثلثية تعطي الشكل الكامل ثلاثي الأبعاد لكل جسم مكتشف. يُطلق على نظامنا اسم Mesh R-CNN، وهو يزيد من قدرات Mask R-CNN بفرع تنبؤ الشبكات الذي يُخرج شبكات ذات بنية طوبولوجية متغيرة من خلال التنبؤ أولاً بتمثيلات فوكسل خشنة يتم تحويلها إلى شبكات ثم تحسينها باستخدام شبكة تلافيف الرسم البياني تعمل على رؤوس وحواف الشبكة. نحن نتحقق من فرع تنبؤ الشبكات الخاص بنا على ShapeNet، حيث نتفوق على الأعمال السابقة في التنبؤ بالشكل من صورة واحدة. ثم نقوم بتطبيق نظام Mesh R-CNN الكامل على Pix3D، حيث نكتشف الأجسام ونتنبأ بأشكالها ثلاثية الأبعاد بشكل مشترك.

شبكة R-CNN | أحدث الأوراق البحثية | HyperAI