Command Palette
Search for a command to run...
Cascade RPN : Exploration d'un réseau de propositions de régions de haute qualité basé sur une convolution adaptative
Cascade RPN : Exploration d'un réseau de propositions de régions de haute qualité basé sur une convolution adaptative
Thang Vu Hyunjun Jang Trung X. Pham Chang D. Yoo
Résumé
Cet article propose une architecture appelée Cascade Region Proposal Network (Cascade RPN) afin d'améliorer la qualité des régions proposées et les performances de détection en abordant de manière systématique les limites de la RPN conventionnelle, qui définit de manière heuristique les ancres et aligne les caractéristiques aux ancres. Premièrement, au lieu d'utiliser plusieurs ancres prédéfinies selon des échelles et rapports d'aspect fixes, la Cascade RPN repose sur une seule ancre par emplacement et effectue une raffinement en plusieurs étapes. Chaque étape devient progressivement plus sévère dans la définition des échantillons positifs, en commençant par une métrique sans ancre, puis en passant à des métriques basées sur les ancres aux étapes suivantes. Deuxièmement, pour assurer un alignement cohérent entre les caractéristiques et les ancres à travers toutes les étapes, nous proposons une convolution adaptative qui prend à la fois les ancres et les caractéristiques d'image comme entrée, et apprend les caractéristiques échantillonnées sous la guidance des ancres. Une implémentation simple de la Cascade RPN en deux étapes atteint une augmentation de 13,4 points en AR par rapport à la RPN conventionnelle, dépassant ainsi toutes les méthodes existantes de proposition de régions. Lorsqu'elle est intégrée à Fast R-CNN et Faster R-CNN, la Cascade RPN améliore respectivement le mAP de détection de 3,1 et 3,5 points. Le code source est mis à disposition publiquement à l'adresse suivante : \url{https://github.com/thangvubk/Cascade-RPN.git}.