il y a 2 mois
BlitzNet : Un réseau profond en temps réel pour la compréhension des scènes
Nikita Dvornik; Konstantin Shmelkov; Julien Mairal; Cordelia Schmid

Résumé
La compréhension en temps réel des scènes est devenue cruciale dans de nombreuses applications telles que la conduite autonome. Dans cet article, nous proposons une architecture profonde appelée BlitzNet, qui effectue conjointement la détection d'objets et la segmentation sémantique en une seule passe avant, permettant ainsi des calculs en temps réel. Outre le gain de calcul lié à l'utilisation d'un seul réseau pour plusieurs tâches, nous montrons que la détection d'objets et la segmentation sémantique se bénéficient mutuellement en termes de précision. Les résultats expérimentaux sur les jeux de données VOC et COCO montrent des performances de pointe pour la détection d'objets et la segmentation parmi les systèmes en temps réel.