Images tangentes pour atténuer la distorsion sphérique

Dans ce travail, nous proposons une nouvelle représentation d’images sphériques appelée « images tangentes », conçue pour faciliter une vision par ordinateur à 360° transférable et évolutif. Inspirés par des techniques en cartographie et en infographie, nous projetons une image sphérique sur un ensemble de grilles d’images localement planes, dont les distorsions sont atténuées, et qui sont tangentes à un icosaèdre subdivisé. En variant indépendamment la résolution de ces grilles par rapport au niveau de subdivision, nous pouvons représenter efficacement des images sphériques de haute résolution tout en bénéficiant de l’approximation sphérique à faible distorsion offerte par l’icosaèdre. Nous montrons que l’entraînement de réseaux de neurones convolutifs standards sur des images tangentes se compare avantageusement aux nombreux noyaux convolutifs spécialisés pour images sphériques qui ont été développés, tout en s’échelonnant efficacement pour gérer des résolutions sphériques nettement plus élevées. En outre, comme notre approche n’exige pas de noyaux spécialisés, nous démontrons qu’il est possible de transférer des réseaux entraînés sur des images perspectives vers des données sphériques sans ajustement fin (fine-tuning), avec une perte de performance limitée. Enfin, nous illustrons que les images tangentes peuvent améliorer la qualité de la détection de caractéristiques rares sur des images sphériques, mettant ainsi en évidence leur utilité pour des tâches classiques de vision par ordinateur telles que la reconstruction 3D à partir de mouvement (structure-from-motion) et la localisation et cartographie simultanées (SLAM).