التدريب الذاتي المتكيف مع المجال للكشف عن الوجه والجسم في الرسومات

الرسومات هي وسيلة قوية للتجريد البصري والتواصل.فهم أشكال متنوعة من الرسومات، بما في ذلك الفنون الرقمية والكاريكاتير والقصص المصورة، كان مشكلة رئيسية تهم مجتمع الرؤية الحاسوبية ومجتمع الرسم الحاسوبي. رغم وجود كميات كبيرة من الرسومات المُرَقَّمة من الكتب المصورة والكاريكاتير، فإنها تحتوي على تباينات أسلوبية شاسعة، مما يتطلب تصنيفًا يدويًا مكلفًا لتدريب معرفات خاصة بالمنطقة (domain-specific recognizers). في هذا البحث، نوضح كيف يمكن استخدام التعلم الذاتي المُشرف عليه ذاتيًا، القائم على شبكة معلم-طالب مع تصميم تحديث معدل للشبكة الطالبة، لبناء كاشفات للوجه والجسم. يتيح لنا الإعداد استغلال كميات كبيرة من البيانات غير المصنفة من المنطقة المستهدفة عندما يتم توفير العلامات فقط لجزء صغير منها. نوضح أيضًا أن نقل الأسلوب يمكن دمجه في خط أنابيب التعلم لدينا لبدء تشغيل الكاشفات باستخدام كمية ضخمة من الصور المصنفة خارج المنطقة من الصور الطبيعية (أي صور العالم الحقيقي). ينتج عن هندستنا المركبة كاشفات ذات أداء رائد (SOTA) وأداء قريب من الرائد (near-SOTA) باستخدام جهد تصنيف بسيط للغاية. يمكن الوصول إلى شفرتنا المصدرية منhttps://github.com/barisbatuhan/DASS_Detector.