DeepCut: تقسيم المجموعة المشتركة وتسميتها لتقدير وضعية متعددة الأشخاص

يتناول هذا البحث مهمة تقدير وضعية الجسم المفصلية لعدة أشخاص في الصور الحقيقية. نقترح منهجًا يحل مشكلتي الكشف وتقدير الوضعية بشكل متزامن: فهو يستنتج عدد الأشخاص في المشهد، ويحدد أجزاء الجسم المخفية، ويفرّق بين أجزاء الجسم للأشخاص الذين يكونون قريبين جدًا من بعضهم البعض. هذه الصياغة المتزامنة تختلف عن الاستراتيجيات السابقة التي تتعامل مع المشكلة من خلال كشف الأشخاص أولاً ثم تقدير وضعية أجسامهم لاحقًا. نقترح صياغة التقسيم والتصنيف لمجموعة فرضيات لأجزاء الجسم تم إنشاؤها باستخدام كاشفات الأجزاء المستندة إلى الشبكات العصبية التلافيفية (CNN). تتضمن صياغتنا، وهي حالة من البرامج الخطية الصحيحة، قمع غير القصوى ضمنيًا على مجموعة المرشحين للأجزاء وتجميعها لتشكيل تكوينات لأجزاء الجسم تتوافق مع القيود الهندسية والمظهرية. أظهرت التجارب على أربع مجموعات بيانات مختلفة نتائج رائدة في مجال تقدير وضعية الشخص الواحد ووضعية عدة أشخاص. النماذج والكود متاحة على الرابط http://pose.mpi-inf.mpg.de.