FCOS : Détection d'objets entièrement convolutive en une seule étape

Nous proposons un détecteur d'objets entièrement convolutif à une seule étape (FCOS) pour résoudre le problème de détection d'objets par prédiction pixel par pixel, similaire à la segmentation sémantique. Presque tous les détecteurs d'objets de pointe actuels, tels que RetinaNet, SSD, YOLOv3 et Faster R-CNN, reposent sur des boîtes d'ancre prédéfinies. En revanche, notre détecteur proposé, FCOS, est exempt de boîtes d'ancre ainsi que de propositions. En éliminant l'ensemble prédéfini de boîtes d'ancre, FCOS évite complètement les calculs complexes liés aux boîtes d'ancre, tels que le calcul des chevauchements pendant l'entraînement. Plus important encore, nous évitons également tous les hyperparamètres associés aux boîtes d'ancre, qui sont souvent très sensibles aux performances finales de détection. Avec comme seul traitement postérieur la suppression non maximale (NMS), FCOS avec ResNeXt-64x4d-101 atteint 44,7 % en AP lors des tests mono-modèle et mono-échelle, surpassant les précédents détecteurs à une seule étape grâce à sa simplicité beaucoup plus grande. Pour la première fois, nous démontrons qu'un cadre de détection beaucoup plus simple et flexible peut atteindre une précision de détection améliorée. Nous espérons que le cadre FCOS proposé puisse servir d'alternative simple et robuste pour de nombreuses autres tâches au niveau des instances. Le code est disponible à : https://tinyurl.com/FCOSv1