Command Palette
Search for a command to run...
الوسائط الجزئية القابلة للتشوه للتعرف الدقيق والتنبؤ بالسمات
الوسائط الجزئية القابلة للتشوه للتعرف الدقيق والتنبؤ بالسمات
Trevor Darrell Forrest Iandola Ryan Farrell Ning Zhang
الملخص
يمكن أن يكون التعرف على الكائنات في المجالات ذات التفاصيل الدقيقة أمرًا بالغ الصعوبة بسبب الفروق الدقيقة بين الفئات الفرعية. غالبًا ما تكون العلامات التمييزية محدودة جدًا في المكان، مما يؤدي إلى صعوبة تواجهها الأساليب التقليدية للتعرف على الكائنات في مواجهة التغيرات الكبيرة في الوضع (pose) التي تظهر غالبًا في هذه المجالات. تهدف طريقة توحيد الوضع (Pose-normalization) إلى محاذاة أمثلة التدريب، إما جزئيًا حسب الأجزاء أو بشكل عام للجسم ككل، مما يُعدّ فعّالًا في إزالة الفروق الناتجة عن الوضع واتجاه الرؤية. اعتمدت الأساليب السابقة على مجموعات مرشحات مكلفة حسابيًا لتحديد مواقع الأجزاء، واحتاجت إلى إشراف مكثف. تقدم هذه الورقة نوعين من الوصفات المُعدّلة حسب الوضع، تعتمد على نماذج الأجزاء المُتغيرة بكفاءة حسابية (Deformable Part Models). الأول يستفيد من المعاني المتأصلة في أجزاء DPM المُدرّبة بقوة (strongly-supervised). والثاني يستغل التسميات المعاني الضعيفة (weak semantic annotations) لتعلم التقابل بين المكونات، ويحسب وصفات مُعدّلة حسب الوضع من الأجزاء الكامنة في نموذج DPM المُدرّب بشكل ضعيف (weakly-supervised). تتيح هذه التمثيلات التجميع عبر التغيرات في الوضع واتجاه الرؤية، مما يسهل إنجاز مهام مثل التعرف الدقيق على الكائنات وتوقع السمات. أظهرت التجارب التي أُجريت على مجموعة بيانات Caltech-UCSD Birds 200 ومجموعة بيانات Berkeley Human Attribute تحسينات كبيرة مقارنة بالخوارزميات الرائدة في مجالها.