تحسين الكشف متعدد المنظورات عن المشاة من خلال سحب الميزات ثلاثية الأبعاد العامة

التحدي الرئيسي في كشف المشاة من عدة زوايا يتمثل في دمج السمات الخاصة بكل زاوية داخل فضاء موحد لتمكين الإدراك الشامل من نهاية إلى نهاية. ركزت الطرق السابقة للكشف من عدة زوايا على إسقاط سمات المنظور على المستوى الأفقي، مما يُنتج تمثيلاً يشبه "منظور الطيور" (BEV) للمنظر. تقدم هذه الورقة بنية بسيطة ولكنها فعّالة تستخدم استراتيجية سحب السمات ثلاثية الأبعاد غير المعلمية. تُستخلص هذه الاستراتيجية مباشرة السمات ثنائية الأبعاد المقابلة لكل مكعب (Voxel) صالح داخل الحجم الثلاثي الأبعاد للسمات، مما يعالج فقدان السمات الذي قد يحدث في الطرق السابقة. كما تُقدّم الإطار المقترح ثلاث وحدات جديدة، صُمّمت كل منها لتعزيز قدرات التعميم في أنظمة الكشف من عدة زوايا. وقد أثبتت النتائج الناتجة عن تجارب واسعة فعالية النموذج المقترح، حيث أظهرت دقة جديدة تُعدّ الأفضل في مجالها، سواء في السيناريوهات التقليدية أو بشكل خاص في سياق معايير تقييم التعميم على المشاهد.