الوضع هو كل ما تحتاجه: نظام التعرف على النشاط الجماعي القائم على الوضع فقط (POGARS)

نقدم نهجًا جديدًا لتحديد الأنشطة الجماعية يعتمد على التعلم العميق يُسمى نظام التعرف على الأنشطة الجماعية بناءً على الوضعية فقط (POGARS)، المصمم لاستخدام فقط الوضعيات المُتتبعَة للأشخاص لتوقع النشاط الجماعي المنفذ. على عكس النهج الحالية في التعرف على الأنشطة الجماعية، يستخدم POGARS الشبكات العصبية التلافيفية ذات البعد الواحد (1D CNNs) لاستخلاص الديناميكيات الزمانية-المكانية للأفراد المشاركين في النشاط الجماعي، مع التخلي عن استخلاص الميزات من بيانات البكسل. ويستخدم النموذج المقترح آلية انتباه مكانية وزمانية لاستخلاص أهمية كل فرد، إلى جانب التعلم متعدد المهام لتحقيق تصنيف النشاط الجماعي والنشاط الفردي في آنٍ واحد. تؤكد النتائج التجريبية أن POGARS يحقق نتائج تنافسية عالية مقارنةً بأفضل الأساليب الحالية على مجموعة بيانات شهيرة للساحة (فوليبول) المفتوحة للجمهور، رغم استخدامه فقط الوضعيات المُتتبعَة كمدخل. علاوةً على ذلك، تُظهر تجاربنا أن استخدام الوضعيات فقط كمدخل يمنح POGARS قدرة تعميم أفضل مقارنةً بالأساليب التي تستخدم الصور باللون الثلاثي (RGB) كمدخل.