CenterPoly : segmentation d'instances en temps réel à l'aide de polygones englobants

Nous présentons une nouvelle méthode, appelée CenterPoly, pour la segmentation d'instances en temps réel à l'aide de polygones de délimitation. Nous l'appliquons pour détecter les usagers de la route dans des environnements urbains denses, ce qui la rend adaptée aux applications dans les systèmes de transport intelligent, tels que les véhicules autonomes. CenterPoly détecte les objets par leur point clé central tout en prédiction un nombre fixe de sommets de polygone pour chaque objet, effectuant ainsi la détection et la segmentation en parallèle. La majorité des paramètres du réseau est partagée entre les têtes du réseau, ce qui le rend suffisamment rapide et léger pour fonctionner à une vitesse en temps réel. Pour convertir correctement le masque vérité-terrain (ground-truth) en vérité-terrain polygonale, nous avons conçu une stratégie de sélection de sommets facilitant l'apprentissage des polygones. De plus, afin de mieux segmenter les objets chevauchants dans des scènes urbaines denses, nous formons également une branche de profondeur relative pour déterminer quels objets sont plus proches et quels sont plus éloignés, en utilisant des annotations faibles disponibles. Nous proposons plusieurs modèles avec différents backbones pour montrer les compromis possibles entre vitesse et précision. Les modèles ont été entraînés et évalués sur Cityscapes, KITTI et IDD, et les résultats sont rapportés sur leurs benchmarks publics, où ils représentent l'état de l'art à des vitesses en temps réel. Le code est disponible à l'adresse https://github.com/hu64/CenterPoly.