التحليل الشامل للإنسان على مستوى الحالة

تحليل الأشياء -- وهي مهمة تفكيك الشيء إلى أجزائه الدلالية -- كان يتم صياغتها تقليديًا كمشكلة تصنيف على مستوى الفئة. نتيجة لذلك، عندما يكون هناك عدة أشياء في الصورة، لا تستطيع الأساليب الحالية عد عدد الأشياء في المشهد، كما أنها لا تستطيع تحديد أي جزء ينتمي إلى أي شيء. نعالج هذه المشكلة من خلال قطع أجزاء الأشياء على مستوى المثال، بحيث يتم تعيين كل بكسل في الصورة بعلامة جزء وكذلك هوية الشيء الذي ينتمي إليه. بالإضافة إلى ذلك، نوضح كيف يمكن لهذا النهج أن يفيدنا أيضًا في الحصول على قطعات بمستويات حبيبية أقل دقة. الشبكة المقترحة لدينا يتم تدريبها بشكل كامل بناءً على الكشف، وتبدأ بوحدة قطع على مستوى الفئة. بعد ذلك، يتم استخدام حقل عشوائي مشروط قابل للتفاضل، محدد على عدد متغير من الأمثلة لكل صورة مدخلة، لاستنتاج هوية كل جزء من خلال ربطه بكشف بشري. بخلاف الأساليب الأخرى، يمكن لطرقنا التعامل مع العدد المتغير للأشخاص في كل صورة، وشبكتنا الشمولية تنتج نتائجًا رائدة في قطع أجزاء الأمثلة والقطع البشري على مستوى المثال، بالإضافة إلى نتائج تنافسية في قطع أجزاء الفئات على مستوى الفئة، وكل ذلك يتم من خلال عملية مرور واحدة فقط عبر شبكتنا العصبية.