HyperAIHyperAI
منذ 11 أيام

مُستخرج الميزات ثلاثية الأبعاد العميق العام

{Raymond Ptucha, Shagan Sah, Saloni Jain, Atir Petkar, Rohan Dhamdhere, Miguel Dominguez}
الملخص

تُستخدم أجهزة الاستشعار العميقة في أنظمة القيادة الذاتية وألعاب الفيديو غالبًا لإرجاع سحابات نقطية ثلاثية الأبعاد. إلا أن نقص البنية الهيكلية في هذه الأجهزة لا يسمح لهذه الأنظمة باستغلال التطورات الحديثة في الشبكات العصبية التلافيفية (Convolutional Neural Networks)، التي تعتمد على عمليات التصفية والتجميع التقليدية. وتشبه هياكل التصفية والتجميع هذه في الشبكات القائمة على الصور، فإن الهياكل القائمة على الرسوم البيانية (Graph-based Architectures) التي تم تقديمها مؤخرًا توفر عمليات تصفية وتجميع مماثلة على الرسوم البيانية غير المنتظمة. ونستخدم هذه الأساليب القائمة على الرسوم البيانية لتحويل سحابات النقاط ثلاثية الأبعاد إلى تمثيل متجهي عام نسميه "الرسم البياني ثلاثي الأبعاد" (Graph 3D أو G3D). ونعتقد أننا أول من استخدم التعلم المنقول على نطاق واسع على بيانات سحابات النقاط ثلاثية الأبعاد، ونُظهر قوة التمييز في تمثيلنا الخفي المميز لسحابات النقاط ثلاثية الأبعاد على مجموعات اختبار غير متوقعة. وباستخدام شبكتنا G3D (G3DNet) كمُستخرج للسمات، ثم ربط متجهات السمات G3D بف-Classifier قياسي، نحقق أعلى دقة على مجموعة بيانات ModelNet10 (93.1%) وModelNet40 (91.7%) ضمن الشبكات الرسومية، مع أداء مماثل للطرق الأخرى على مجموعة بيانات Sydney Urban Objects. ويمكن استخدام هذا المستخرج العام للسمات كمكون جاهز للاستخدام في مشاريع أخرى تتعلق بفهم المشاهد ثلاثية الأبعاد أو تتبع الكائنات.

مُستخرج الميزات ثلاثية الأبعاد العميق العام | أحدث الأوراق البحثية | HyperAI