HyperAIHyperAI
منذ 16 أيام

PointRGCN: شبكات الت convolution الرسومية لتحسين كشف المركبات ثلاثية الأبعاد

Jesus Zarzar, Silvio Giancola, Bernard Ghanem
PointRGCN: شبكات الت convolution الرسومية لتحسين كشف المركبات ثلاثية الأبعاد
الملخص

في أنظمة القيادة الذاتية، تُوفّر وحدات الإدراك فهمًا بصريًا للمنظر المحيط بالطريق. ومن بين مهام الإدراك، يُعدّ كشف المركبات من المهام الأساسية لضمان السلامة في القيادة، حيث يُحدد موقع الوكلاء الآخرين الذين يشاركون الطريق. في عملنا، نُقدّم PointRGCN: وهي نموذج للكشف عن الأجسام ثلاثية الأبعاد مبني على الشبكات الرسومية (GCNs) يعمل حصريًا على سحابات النقاط ثلاثية الأبعاد من مستشعر LiDAR. ولتحقيق كشف ثلاثي الأبعاد أكثر دقة، نستفيد من تمثيل رسومي يُجري تجميعًا للسمات والاتصالات (السياق) من المقترحات. ونُدمج شبكات GCNs المتبقية (Residual GCNs) في نموذج كشف ثلاثي الأبعاد مكون من مرحلتين، حيث تُحسّن المقترحات الثلاثية الأبعاد باستخدام تمثيل رسومي جديد. وبشكل خاص، تُعدّ R-GCN شبكة GCN متبقية تُصنّف وتحسّن المقترحات الثلاثية الأبعاد، في حين أن C-GCN هي شبكة GCN سياقية تُحسّن المقترحات بشكل إضافي من خلال مشاركة المعلومات السياقية بين عدة مقترحات. ونُدمج وحدات التحسين هذه في نموذج كشف ثلاثي أبعاد جديد يُسمّى PointRGCN، ونحقق أداءً متميزًا على مستوى الصعوبة البسيطة في مهمة الكشف من منظور الطيور (Bird's Eye View).

PointRGCN: شبكات الت convolution الرسومية لتحسين كشف المركبات ثلاثية الأبعاد | أحدث الأوراق البحثية | HyperAI