HyperAIHyperAI
منذ 2 أشهر

ويلدكات: التعلم المراقب الضعيف للشبكات العميقة المُConvNets لتصنيف الصور والتحديد النقطي والتقسيم

{Nicolas Thome, Taylor Mordan, Matthieu Cord, Thibaut Durand}
ويلدكات: التعلم المراقب الضعيف للشبكات العميقة المُConvNets لتصنيف الصور والتحديد النقطي والتقسيم
الملخص

يُقدّم هذا البحث منهج WILDCAT، وهو أسلوب تعليم عميق يهدف بشكل مشترك إلى محاذاة مناطق الصور للحصول على التماثل المكاني وتعلم ميزات موضعية قوية. يتم تدريب نموذجنا باستخدام علامات صورة عامة فقط، ويُركّز على ثلاث مهام رئيسية في التعرف البصري: تصنيف الصور، وتحديد الكائنات بطرق ضعيفة التدريب، والتقسيم الدلالي. يُوسّع نموذج WILDCAT من التقنيات الرائدة في الشبكات العصبية التلافيفية (Convolutional Neural Networks) على ثلاثة مستويات رئيسية: استخدام الشبكات التلافيفية الكاملة (Fully Convolutional Networks) للحفاظ على الدقة المكانية، وتصميم صريح داخل الشبكة لميزات محلية مرتبطة بأنماط فئات مختلفة، وطريقة جديدة لاستخلاص هذه الميزات (Pooling) لتوفير تنبؤ بصري شامل مطلوب لتدريب النموذج بطرق ضعيفة التدريب. تُظهر التجارب الواسعة أن نموذجنا يتفوّق بشكل ملحوظ على الأساليب الرائدة في المجال.