فهم المشهد الاجتماعي: تحديد موقع أنشطة متعددة الأشخاص وتعرف النشاط الجماعي من البداية إلى النهاية

نقدم إطارًا موحدًا لفهم السلوكيات الاجتماعية البشرية في سلاسل الصور الخام. يكتشف نموذجنا بشكل مشترك عدة أفراد، ويستنتج أفعالهم الاجتماعية، ويقدّر الأنشطة الجماعية بمرور واحد تتابعي عبر شبكة عصبية. نقترح هندسة واحدة لا تعتمد على خوارزميات الكشف الخارجية بل يتم تدريبها من البداية إلى النهاية لإنتاج خرائط اقتراح كثيفة يتم تحسينها من خلال نظام استدلال جديد. يتم التعامل مع الاستمرارية الزمنية من خلال شبكة عصبية متكررة تعمل على مستوى الفرد. يأخذ النموذج الكامل كمدخل سلسلة من الإطارات ويعطي كمخرج الاكتشافات بالإضافة إلى تقديرات الأفعال الفردية والأنشطة الجماعية. نظهر أداءً رائدًا لخوارزميتنا على عدة مقاييس عامة متاحة للجمهور.注释:- "feed-forward pass" 翻译为 "مرور واحد تتابعي",这是神经网络中前向传播的通用译法。- "Recurrent Neural Network" 翻译为 "شبكة عصبية متكررة",这是循环神经网络的通用译法。- "benchmarks" 翻译为 "مقاييس"،这是在科技领域中常用的术语。