HyperAIHyperAI
منذ 2 أشهر

PANDA: شبكات محاذاة الوضع للنمذجة العميقة للسمات

Zhang, Ning ; Paluri, Manohar ; Ranzato, Marc'Aurelio ; Darrell, Trevor ; Bourdev, Lubomir
PANDA: شبكات محاذاة الوضع للنمذجة العميقة للسمات
الملخص

نقترح طريقة لاستنتاج الصفات البشرية (مثل الجنس، أسلوب الشعر، أسلوب الملابس، التعبير، الحركة) من صور الأشخاص تحت تباين كبير في الزاوية البصرية، الوضعية، المظهر، التحريك والاخفاء. لقد أثبتت شبكات العصبونات المتكررة (CNN) أنها تؤدي بشكل ممتاز في مشاكل التعرف على الأشياء على نطاق واسع. ومع ذلك، في سياق تصنيف الصفات، تكون الإشارة غالبًا خفية وقد تغطي فقط جزءًا صغيرًا من الصورة بينما تكون الصورة مهيمنة بتأثيرات الوضعية وزاوية النظر. ستتطلب التعويض عن تباين الوضعية التدريب على مجموعات بيانات كبيرة ومصنفة والتي ليست متاحة حاليًا. لقد أثبتت النماذج القائمة على الأجزاء مثل الـ "Poselets" و "DPM" أنها تعمل بشكل جيد لهذه المشكلة ولكنها محدودة بالخصائص السطحية الضحلة. نقترح طريقة جديدة تجمع بين النماذج القائمة على الأجزاء والتعلم العميق من خلال تدريب شبكات العصبونات المتكررة المُعَدَّلَة للوضعية (الإشارات). نبين وجود تحسن كبير مقابل أفضل الأساليب الحالية في مهام تصنيف الصفات الصعبة في بيئات غير مقيدة. وتؤكد التجارب أن طريقتنا تتفوق على أفضل النماذج القائمة على الأجزاء لهذه المشكلة وعلى شبكات العصبونات المتكررة التقليدية التي تم تدريبها على الحدود الكاملة للشخص.

PANDA: شبكات محاذاة الوضع للنمذجة العميقة للسمات | أحدث الأوراق البحثية | HyperAI