HyperAIHyperAI
il y a un mois

Formation de détecteurs d'objets basés sur des régions avec l'extraction en ligne d'exemples difficiles

Abhinav Shrivastava; Abhinav Gupta; Ross Girshick
Formation de détecteurs d'objets basés sur des régions avec l'extraction en ligne d'exemples difficiles
Résumé

Le domaine de la détection d'objets a connu des avancées significatives grâce à l'essor des réseaux de neurones convolutifs basés sur des régions (region-based ConvNets), mais leur procédure d'entraînement inclut encore de nombreuses heuristiques et hyperparamètres coûteux à ajuster. Nous présentons un algorithme simple mais surprenamment efficace de minage en ligne d'exemples difficiles (Online Hard Example Mining, OHEM) pour l'entraînement de détecteurs basés sur des réseaux de neurones convolutifs. Notre motivation est la même que toujours : les ensembles de données de détection contiennent un nombre écrasant d'exemples faciles et un petit nombre d'exemples difficiles. La sélection automatique de ces exemples difficiles peut rendre l'entraînement plus efficace et plus rapide. L'OHEM est un algorithme simple et intuitif qui élimine plusieurs heuristiques et hyperparamètres couramment utilisés. Mais plus important encore, il offre des améliorations constantes et significatives des performances de détection sur des benchmarks tels que PASCAL VOC 2007 et 2012. Son efficacité augmente lorsque les ensembles de données deviennent plus volumineux et plus complexes, comme le montrent les résultats obtenus sur le jeu de données MS COCO. De plus, combiné avec d'autres progrès complémentaires dans le domaine, l'OHEM conduit à des résultats d'état de l'art avec un mAP (mean Average Precision) respectivement de 78,9 % et 76,3 % sur PASCAL VOC 2007 et 2012.