HEDNet: شبكة مشفرة-فك مشفرة هيراركية للكشف عن الأجسام ثلاثية الأبعاد في السحابات النقطية

كDetection الكائنات ثلاثية الأبعاد في السحاب النقطية أمر بالغ الأهمية لأنظمة القيادة الذاتية. تكمن التحدي الرئيسي في كDetec tion الكائنات ثلاثية الأبعاد في التوزيع النادر للنقاط داخل المشهد ثلاثي الأبعاد. تُستخدم الطرق عالية الأداء الحالية عادةً الشبكات العصبية التلافيفية ثلاثية الأبعاد ذات التلافيف النادرة مع حُرُوف صغيرة لاستخراج السمات. ولتقليل التكاليف الحسابية، تلجأ هذه الطرق إلى التلافيف النادرة الفرعية، والتي تمنع تبادل المعلومات بين السمات غير المتصلة مكانيًا. حاولت بعض الطرق الحديثة معالجة هذه المشكلة من خلال إدخال تلافيف ذات حُرُوف كبيرة أو آليات الانتباه الذاتي، لكنها إما حققت تحسينات محدودة في الدقة أو تسببت في تكاليف حسابية مفرطة. نقترح HEDNet، وهي شبكة ترميز-إعادة ترميز هرمية للكشف عن الكائنات ثلاثية الأبعاد، والتي تُستخدَم فيها كتل الترميز-إعادة الترميز لالتقاط الاعتماديات طويلة المدى بين السمات في الفضاء المكاني، خاصةً بالنسبة للكائنات الكبيرة والبعيدة. أجرينا تجارب واسعة على مجموعتي بيانات Waymo Open وnuScenes. حققت HEDNet دقة كشف أفضل من الطرق السابقة التي تُعدّ من أحدث الطرق المتطورة على كلا المجموعتين، مع كفاءة تنافسية. يمكن الوصول إلى الكود من خلال الرابط التالي: https://github.com/zhanggang001/HEDNet.