تتبع وضعية متعددة الأشخاص في البُعد الثاني بكفاءة عبر الإنترنت باستخدام حقول الارتباط المكاني الزمني المتكررة

نقدم نهجًا عبر الإنترنت للكشف عن وتعقب وضعية ثنائية الأبعاد (2D) للعديد من الأشخاص في سلسلة فيديو بكفاءة وفي الوقت نفسه. نعتمد على تمثيل حقول الارتباط الجزئي (PAF) المصمم للصور الثابتة، ونقترح بنية قادرة على ترميز وتوقع الحقول المكانية-الزمانية المرتبطة (STAF) عبر سلسلة الفيديو. بشكل خاص، نقترح طوبولوجيا زمنية جديدة مرتبطة بين الأطراف يمكنها التعامل مع حركات الجسم بتسامح كبير. بالإضافة إلى ذلك، نجعل النهج كله متكررًا بطبيعته، حيث يتناول الشبكة الخرائط الحرارية لـ STAF من الإطارات السابقة ويقدر تلك الخاصة بالإطار الحالي. يستخدم نهجنا فقط الاستدلال والتعقب عبر الإنترنت، وهو حاليًا أسرع وأكثر دقة في النهج السفلي-الأعلى الذي يكون ثابت الرuntime بالنسبة لعدد الأشخاص في المشهد وثابت الدقة بالنسبة لمعدل الإطارات الدخولية للكاميرا. يعمل بمعدل حوالي 30 إطارًا في الثانية على وحدة معالجة رسومية واحدة وبمقياس واحد، ويحقق نتائج تنافسية للغاية على مقاييس PoseTrack.