Meta-RCNN : apprentissage méta pour la détection d'objets en peu d'exemples

Malgré les progrès significatifs réalisés récemment dans la détection d'objets, l'entraînement de détecteurs performants dans un régime de faibles données reste un défi ouvert. L’étiquetage des données d’entraînement pour la détection d’objets est extrêmement coûteux, ce qui rend nécessaire le développement de techniques capables de généraliser efficacement à partir de faibles quantités de données étiquetées. Nous étudions ce problème de détection d’objets en peu d’exemples (few-shot object detection), dans lequel un détecteur dispose uniquement d’un nombre limité de données annotées. À partir du principe récemment émergent de méta-apprentissage, nous proposons un nouveau cadre de méta-apprentissage pour la détection d’objets nommé « Meta-RCNN », qui apprend la capacité à effectuer une détection en peu d’exemples grâce au méta-apprentissage. Plus précisément, Meta-RCNN apprend un détecteur d’objets selon un paradigme d’apprentissage épisodique sur les données d’entraînement (méta) d’apprentissage. Ce schéma d’apprentissage permet d’acquérir un a priori qui permet à Meta-RCNN de réaliser une détection en peu d’exemples sur de nouvelles tâches. Basé sur le modèle Faster RCNN, dans Meta-RCNN, à la fois le réseau de proposition de régions (RPN) et la branche de classification d’objets sont méta-apprentis. Le RPN méta-entraîné apprend à générer des propositions spécifiques aux classes, tandis que le classificateur d’objets apprend à effectuer une classification en peu d’exemples. Les nouvelles fonctions de perte et la stratégie d’apprentissage de Meta-RCNN peuvent être entraînées de manière end-to-end. Nous démontrons l’efficacité de Meta-RCNN pour résoudre le problème de détection en peu d’exemples sur le jeu de données Pascal VOC, obtenant des résultats prometteurs.