HyperAIHyperAI
منذ 16 أيام

الكشف العام عن المشاة: الفيل في الغرفة

Irtiza Hasan, Shengcai Liao, Jinpeng Li, Saad Ullah Akram, Ling Shao
الكشف العام عن المشاة: الفيل في الغرفة
الملخص

يُستخدم الكشف عن المشاة في العديد من التطبيقات القائمة على الرؤية، بدءًا من مراقبة الفيديو وصولاً إلى القيادة الذاتية. وعلى الرغم من تحقيق أداء عالٍ، إلا أن مدى قدرة الكواشف الحالية على التعميم على بيانات غير مرئية ما زال غير معروف إلى حد كبير. ويعتبر هذا الأمر مهمًا لأن كاشفًا عمليًا ينبغي أن يكون جاهزًا للاستخدام في سيناريوهات متنوعة ضمن التطبيقات المختلفة. ولتحقيق ذلك، نُجري في هذه الورقة دراسة شاملة باستخدام مبدأ عام يتمثل في التقييم المباشر عبر المجموعات المختلفة للبيانات. ومن خلال هذه الدراسة، نجد أن الكواشف الرائدة حاليًا في مجال كشف المشاة، رغم أدائها الجيد عند تدريبها واختبارها على نفس مجموعة البيانات، إلا أنها تُظهر أداءً ضعيفًا في تقييم التعميم عبر مجموعات بيانات مختلفة. ونُظهر أن هناك سببين لهذا الاتجاه. أولًا، قد تكون تصاميم هذه الكواشف (مثل إعدادات المفاتيح أو المراجع المرجعية) متحيزة نحو المعايير الشهيرة في أنماط التدريب والاختبار التقليدية التي تعتمد على مجموعة بيانات واحدة، مما يؤدي إلى تقييد قدرتها على التعميم بشكل كبير. ثانيًا، فإن مصادر التدريب عادة ما تكون غير كثيفة من حيث عدد المشاة، وغير متنوعة من حيث السيناريوهات. وباستخدام التقييم المباشر عبر المجموعات المختلفة للبيانات، نلاحظ بشكل مفاجئ أن كاشف الكائنات العام، دون أي تعديلات مخصصة للكشف عن المشاة في التصميم، يُظهر أداءً أفضل بكثير من الكواشف الرائدة الحالية. علاوةً على ذلك، نوضح أن مجموعات البيانات المتنوعة والكثيفة، التي تم جمعها عبر تصفح الإنترنت، يمكن أن تكون مصدرًا فعّالًا لمرحلة التدريب المسبق (pre-training) في كشف المشاة. وبناءً على ذلك، نقترح نموذج تدريب تدريجي (progressive training pipeline)، ونجد أنه يعمل بشكل جيد في تطبيقات كشف المشاة الموجهة للقيادة الذاتية. وبالتالي، تشير الدراسة التي أجريت في هذه الورقة إلى أن الاهتمام ينبغي أن يُركّز بشكل أكبر على تقييم التعميم عبر المجموعات المختلفة للبيانات عند تصميم كواشف المشاة القابلة للتعميم في المستقبل. يمكن الوصول إلى الكود والنموذج عبر الرابط: https://github.com/hasanirtiza/Pedestron.

الكشف العام عن المشاة: الفيل في الغرفة | أحدث الأوراق البحثية | HyperAI