تدفق الوضع: تتبع الوضع الفعال عبر الإنترنت

تعقب الوضعيات المفصلية للأشخاص المتعددين في مقاطع الفيديو غير المقيدة هو مشكلة مهمة ومعقدة. في هذا البحث، وعلى طريق النهج العلوي (top-down)، نقترح متعقب وضعيات جيد وكفؤ يعتمد على تدفقات الوضعيات (Pose Flows). أولاً، صممنا إطارًا برمجيًا للتحسين عبر الإنترنت لبناء ارتباط بين الوضعيات عبر الإطارات وتشكيل تدفقات الوضعيات (PF-Builder). ثانيًا، تم تصميم آلية جديدة لقمع القمم غير القصوى لتدفقات الوضعيات (PF-NMS) لتقليل التكرارات الزائدة من تدفقات الوضعيات وإعادة ربطها بشكل متين عند انقطاعها زمنيًا. أظهرت التجارب الواسعة أن طريقتنا تتفوق بشكل كبير على أفضل النتائج المبلغ عنها في مجموعتي بيانات تعقب الوضعية القياسيتين بمقدار 13 نقطة مئوية في mAP و25 نقطة مئوية في MOTA وفي الثانية بمقدار 6 نقاط مئوية في mAP و3 نقاط مئوية في MOTA. علاوة على ذلك، في حالة العمل مع الوضعيات المكتشفة في الإطارات الفردية، يكون الحساب الإضافي لمتعقب الوضعيات قليلًا للغاية، مما يضمن التعقب عبر الإنترنت بمعدل 10 إطارًا لكل ثانية. لقد جعلنا كود المصدر الخاص بنا متاحًا للجمهور (https://github.com/YuliangXiu/PoseFlow).