Command Palette
Search for a command to run...
RBGNet: تجميع مبني على الشعاع للكشف عن الكائنات ثلاثية الأبعاد
RBGNet: تجميع مبني على الشعاع للكشف عن الكائنات ثلاثية الأبعاد
Haiyang Wang Shaoshuai Shi Ze Yang Rongyao Fang Qi Qian Hongsheng Li Bernt Schiele Liwei Wang
الملخص
كمسألة أساسية في رؤية الحاسوب، تشهد كشف الكائنات ثلاثية الأبعاد نمواً سريعاً. ولاستخلاص السمات النقطية من النقاط الموزعة بشكل غير منتظم ونادر، اعتمدت الطرق السابقة عادةً على وحدة تجميع السمات لدمج سمات النقط إلى مرشحات كائنات. ومع ذلك، لم تُستغل هذه الطرق بعد البنية الهندسية للسطوح الخاصة بالكائنات الأمامية لتعزيز عملية التجميع وإنشاء الصناديق ثلاثية الأبعاد. في هذه الورقة، نقترح إطار عمل يُدعى RBGNet، وهو كاشف ثلاثي الأبعاد مبني على التصويت، يهدف إلى كشف الكائنات بدقة من السحابات النقطية. ولتحسين تمثيل شكل الكائن لتعزيز سمات التجميع في التنبؤ بالصناديق ثلاثية الأبعاد، نقترح وحدة تجميع سمات تعتمد على الأشعة، حيث يتم تجميع السمات النقطية على أسطح الكائنات باستخدام مجموعة من الأشعة المحددة التي تُنطلق بشكل موحد من مراكز التجميع. وبما أن النقاط الأمامية أكثر أهمية في تقدير الصناديق، قمنا بتصميم استراتيجية جديدة للعينة متحيزة نحو الكائنات الأمامية أثناء عملية التخفيف، بهدف أخذ عدد أكبر من النقاط على أسطح الكائنات، مما يعزز أداء الكشف بشكل أكبر. يحقق نموذجنا أداءً رائداً في كشف الكائنات ثلاثية الأبعاد على مجموعتي بيانات ScanNet V2 وSUN RGB-D، مع مكاسب ملحوظة في الأداء. سيتم إتاحة الشفرة المصدرية على الرابط: https://github.com/Haiyang-W/RBGNet.