Command Palette
Search for a command to run...
Réseau de neurones convolutifs profonds multi-échelles unifié pour une détection rapide d'objets
Réseau de neurones convolutifs profonds multi-échelles unifié pour une détection rapide d'objets
Cai Zhaowei Fan Quanfu Feris Rogerio S. Vasconcelos Nuno
Résumé
Nous proposons un réseau neuronal profond unifié, dénommé CNN multi-échelle (MS-CNN), destiné à détecter rapidement les objets à différentes échelles. Le MS-CNN se compose d’un sous-réseau de propositions et d’un sous-réseau de détection. Dans le sous-réseau de propositions, la détection est effectuée sur plusieurs couches de sortie, de manière à ce que les champs réceptifs correspondent aux objets de différentes tailles. Ces détecteurs spécifiques à l’échelle, complémentaires, sont combinés afin de former un détecteur robuste d’objets multi-échelle. Le réseau unifié est appris de bout en bout, en optimisant une fonction de perte multi-tâches. Une interpolation par déconvolution est également explorée comme alternative à l’interpolation d’entrée, afin de réduire les coûts mémoire et computationnels. Des performances de détection d’objets parmi les meilleures à ce jour, atteignant jusqu’à 15 images par seconde, sont rapportées sur des jeux de données tels que KITTI et Caltech, qui contiennent un grand nombre d’objets de petite taille.