ArtTrack: تتبع متعدد الأشخاص المفصل في البيئة الطبيعية

في هذا البحث، نقترح منهجية لتعقب الأشخاص المتعددين بحراكاتهم في مقاطع الفيديو غير المقيدة. نقطة انطلاقنا هي نموذج يشبه المعماريات الموجودة لتقدير الوضعية في الإطار الواحد، ولكنه أسرع بكثير. نحقق هذا الأمر بطريقتين: (1) بتبسيط وتخفيف كثافة رسم بياني علاقات أجزاء الجسم واستخدام طرق حديثة للاستدلال السريع، و(2) بنقل حصة كبيرة من الحسابات إلى معمارية تجميعية تقدمية قادرة على اكتشاف وتجميع مفاصل الجسم لنفس الشخص حتى في البيئات المعقدة. نستخدم هذا النموذج لإنشاء اقتراحات لمواقع مفاصل الجسم ونقوم بصياغة تعقب الحراكات كعملية تجميع زماني-مكاني لهذه الاقتراحات. هذا يتيح حل مشكلة التجميع لكل الأشخاص في المشهد بشكل متزامن من خلال نشر الأدلة من الاستدلالات القوية عبر الزمن والالتزام بالقيود التي تنص على أن كل اقتراح يمكن أن يُنسب إلى شخص واحد فقط. نقدم النتائج على معيار وضعية الإنسان العام من معهد ماكس بلانك لعلم المعلومات (MPII Human Pose) وعلى مجموعة بيانات جديدة للفيديو تحتوي على سلاسل صور لأكثر من شخص (MPII Video Pose). نثبت أن نموذجنا يحقق أفضل النتائج الحالية باستخدام جزء صغير فقط من الوقت وأنه قادر على استغلال المعلومات الزمنية لتحسين أفضل النتائج الحالية في المشاهد المزدحمة.