Command Palette
Search for a command to run...
Pré-entraînement auto-supervisé adaptable au domaine pour la détection de visages et de corps dans les dessins
Pré-entraînement auto-supervisé adaptable au domaine pour la détection de visages et de corps dans les dessins
Topal Barış Batuhan ; Yuret Deniz ; Sezgin Tevfik Metin
Résumé
Les dessins sont des moyens puissants d'abstraction et de communication visuelle. La compréhension de diverses formes de dessins, y compris les arts numériques, les dessins animés et les bandes dessinées, a été un problème majeur d'intérêt pour les communautés de la vision par ordinateur et de la graphique informatique. Bien qu'il existe de grandes quantités de dessins numérisés provenant de livres de bande dessinée et de dessins animés, ils présentent d'importantes variations stylistiques, ce qui nécessite une étiquetage manuel coûteux pour former des reconnaiseurs spécifiques à un domaine. Dans cette étude, nous montrons comment l'apprentissage auto-supervisé, basé sur un réseau enseignant-étudiant avec une conception modifiée de la mise à jour du réseau étudiant, peut être utilisé pour construire des détecteurs de visages et de corps. Notre configuration permet d'exploiter de grandes quantités de données non étiquetées issues du domaine cible lorsque des étiquettes ne sont fournies que pour une petite partie d'entre elles. Nous démontrons également que le transfert de style peut être intégré dans notre pipeline d'apprentissage pour initialiser les détecteurs en utilisant une vaste quantité d'images étiquetées hors domaine provenant d'images naturelles (c'est-à-dire des images du monde réel). Notre architecture combinée produit des détecteurs avec des performances au niveau de l'état de l'art (SOTA) et quasi-état de l'art en utilisant un effort minimal d'annotation. Notre code est disponible sur https://github.com/barisbatuhan/DASS_Detector.