Command Palette
Search for a command to run...
بندَا: الشبكات المُحاذاة بالوضع لنمذجة السمات العميقة
بندَا: الشبكات المُحاذاة بالوضع لنمذجة السمات العميقة
Zhang Ning Paluri Manohar Ranzato Marc'Aurelio Darrell Trevor Bourdev Lubomir
الملخص
نُقدّم طريقة لاستنتاج السمات البشرية (مثل الجنس، ونوعية الشعر، ونمط الملابس، والتعبير، والحركة) من صور الأشخاص التي تختلف بشكل كبير في الزاوية المرئية، والوضعية، والملامح، والتحريك، والتشويش الناتج عن التغطية الجزئية. وقد أُثبت أن الشبكات العصبية التلافيفية (CNN) تُظهر أداءً ممتازًا في مسائل التعرف على الكائنات على نطاق واسع. ومع ذلك، في سياق تصنيف السمات، تكون الإشارة غالبًا خفية جدًا وقد تمتد فقط على جزء صغير من الصورة، بينما تهيمن على الصورة تأثيرات الوضعية والزاوية المرئية. ويتطلب التغلب على تأثيرات التغير في الوضعية تدريبًا على مجموعات بيانات مُوسومة كبيرة جدًا، والتي لا تتوفر حاليًا. وقد أُثبت أن النماذج القائمة على الأجزاء، مثل "Poselets" و"DPM"، تُظهر أداءً جيدًا في هذا المجال، لكنها محدودة بوجود ميزات منخفضة المستوى سطحية. نقترح طريقة جديدة تجمع بين النماذج القائمة على الأجزاء والتعلم العميق من خلال تدريب شبكات عصبية تلافيفية مُعدّلة حسب الوضعية (pose-normalized CNNs). ونُظهر تحسنًا ملحوظًا مقارنةً بأفضل الطرق الحالية في مهام تصنيف السمات الصعبة ضمن بيئات غير محددة. وتدعم التجارب أن طريقةنا تتفوق على أفضل النماذج القائمة على الأجزاء في هذا المجال، وكذلك على الشبكات العصبية التلافيفية التقليدية التي تم تدريبها على الصندوق المحيط الكامل للشخص.