N-ImageNet : Vers une reconnaissance d'objets fine et robuste à l'aide de caméras à événements

Nous introduisons N-ImageNet, un grand jeu de données dédié à la reconnaissance fine et robuste d'objets à l'aide de caméras à événements. Ce jeu de données a été collecté à l’aide d’un matériel programmable, dans lequel une caméra à événements se déplace de manière continue devant un écran affichant des images provenant d’ImageNet. N-ImageNet constitue un défi important pour la reconnaissance d’objets basée sur les événements, en raison du grand nombre de classes et d’échantillons qu’il contient. Nous montrons empiriquement que le pré-entraînement sur N-ImageNet améliore les performances des classifieurs basés sur les événements et facilite leur apprentissage avec peu de données étiquetées. En outre, nous proposons plusieurs variantes de N-ImageNet afin d’évaluer la robustesse des classifieurs basés sur les événements sous diverses trajectoires de caméra et des conditions d’éclairage extrêmes, et introduisons une nouvelle représentation d’événements pour atténuer la dégradation des performances. À notre connaissance, nous sommes les premiers à étudier de manière quantitative les effets des différentes conditions environnementales sur les algorithmes de reconnaissance d’objets basés sur les événements. N-ImageNet et ses variantes devraient guider les applications pratiques visant à déployer des algorithmes de reconnaissance d’objets basés sur les événements dans des environnements réels.