Pose2Seg: تقسيم نسخ البشر دون الكشف عنها

النهج القياسي لتقسيم الصور إلى مثيلات هو أولاً تنفيذ كشف الأشياء، ثم تقسيم الشيء من صندوق الكشف المحيط. مؤخراً، أساليب التعلم العميق مثل Mask R-CNN تؤدي هذه المهام بشكل مشترك. ومع ذلك، فإن القليل من الأبحاث يأخذ بعين الاعتبار الفريدة من نوعها فئة "الإنسان"، والتي يمكن تعريفها بدقة بواسطة هيكل الوضع (Pose Skeleton). بالإضافة إلى ذلك، يمكن استخدام هيكل وضع الإنسان لتمييز المثيلات التي تعاني من الإخفاء الشديد بشكل أفضل من استخدام صناديق الحدود (Bounding Boxes). في هذا البحث، نقدم إطارًا جديدًا تمامًا لتقسيم المثيلات بناءً على الوضع للإنسان، والذي يقوم بتقسيم المثيلات استنادًا إلى وضع الإنسان بدلاً من كشف المنطقة المقترحة. نثبت أن إطارنا القائم على الوضع يمكنه تحقيق دقة أعلى من النهج القائم على الكشف الأكثر تقدمًا في مشكلة تقسيم مثيلات الإنسان، ويمكنه التعامل مع الإخفاء بشكل أفضل. علاوة على ذلك، هناك قلة من قواعد البيانات العامة التي تحتوي على العديد من الأشخاص الذين يعانون من الإخفاء الشديد مع شروح شاملة، مما يجعل هذه المشكلة تحديًا نادرًا ما يلاحظه الباحثون. لذلك، في هذا البحث نقدم مقاييس جديدة تسمى "Occluded Human (OCHuman)"، والتي تركز على الأشخاص الذين يعانون من الإخفاء الشديد مع شروح شاملة تشمل صناديق الحدود ووضع الإنسان وأقنعة المثيلات. تحتوي هذه القاعدة بيانات على 8110 مثال إنسان تم توضيحها بالتفصيل ضمن 4731 صورة. بمتوسط 0.67 MaxIoU لكل شخص، يعتبر OCHuman أكثر قاعدة بيانات تعقيداً وتحدياً مرتبطة بتقسيم مثيلات الإنسان. من خلال هذه القاعدة بيانات، نرغب في تسليط الضوء على الإخفاء كمشكلة تحدي للباحثين للدراسة.