منذ 8 أشهر

الملخص

يمكن أن يكون التعرف على الكائنات في المجالات ذات التفاصيل الدقيقة أمرًا بالغ الصعوبة بسبب الفروق الدقيقة بين الفئات الفرعية. غالبًا ما تكون العلامات التمييزية محدودة جدًا في المكان، مما يؤدي إلى صعوبة تواجهها الأساليب التقليدية للتعرف على الكائنات في مواجهة التغيرات الكبيرة في الوضع (pose) التي تظهر غالبًا في هذه المجالات. تهدف طريقة توحيد الوضع (Pose-normalization) إلى محاذاة أمثلة التدريب، إما جزئيًا حسب الأجزاء أو بشكل عام للجسم ككل، مما يُعدّ فعّالًا في إزالة الفروق الناتجة عن الوضع واتجاه الرؤية. اعتمدت الأساليب السابقة على مجموعات مرشحات مكلفة حسابيًا لتحديد مواقع الأجزاء، واحتاجت إلى إشراف مكثف. تقدم هذه الورقة نوعين من الوصفات المُعدّلة حسب الوضع، تعتمد على نماذج الأجزاء المُتغيرة بكفاءة حسابية (Deformable Part Models). الأول يستفيد من المعاني المتأصلة في أجزاء DPM المُدرّبة بقوة (strongly-supervised). والثاني يستغل التسميات المعاني الضعيفة (weak semantic annotations) لتعلم التقابل بين المكونات، ويحسب وصفات مُعدّلة حسب الوضع من الأجزاء الكامنة في نموذج DPM المُدرّب بشكل ضعيف (weakly-supervised). تتيح هذه التمثيلات التجميع عبر التغيرات في الوضع واتجاه الرؤية، مما يسهل إنجاز مهام مثل التعرف الدقيق على الكائنات وتوقع السمات. أظهرت التجارب التي أُجريت على مجموعة بيانات Caltech-UCSD Birds 200 ومجموعة بيانات Berkeley Human Attribute تحسينات كبيرة مقارنة بالخوارزميات الرائدة في مجالها.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار