FTNet : Réseau de transversalité des caractéristiques pour la segmentation sémantique d'images thermiques
L'imagerie thermique est un procédé qui utilise le rayonnement infrarouge et l'énergie thermique pour acquérir des informations sur les objets. Elle présente un avantage significatif par rapport à l'imagerie visible grâce à sa capacité à fonctionner dans l'obscurité et à résister aux variations d'éclairage. En outre, elle possède un potentiel à pénétrer la fumée, les aérosols, la poussière et le brouillard — des obstacles critiques pour les applications d'imagerie visible, y compris la segmentation sémantique. Malheureusement, les méthodes actuelles de pointe en segmentation sémantique d’images (i) se concentrent principalement sur les images du spectre visible, ce qui ne permet pas de capturer adéquatement le contexte des pixels correspondants, notamment les détails aux contours dans les images thermiques, et (ii) imposent un compromis entre une plus grande précision et une vitesse réduite, ou inversement. Dans cette étude, nous proposons une nouvelle architecture de réseau neuronal convolutif entraînable de bout en bout, appelée Feature Transverse Network (FTNet), afin de résoudre ces problèmes. FTNet capture et optimise la représentation des caractéristiques à plusieurs échelles de résolution, améliorant ainsi la capacité à traiter des images haute résolution tout en produisant des résultats de qualité à un coût computationnel réduit. Des expérimentations informatiques étendues ont été menées sur des jeux de données thermiques publics et largement utilisés, notamment SODA, MFNet et SCUT-Seg, afin de démontrer l’efficacité du FTNet par rapport aux méthodes de pointe. Cette comparaison couvre plusieurs aspects, notamment la précision quantitative et la vitesse des différentes approches. Le code source est disponible à l’adresse suivante : https://github.com/shreyaskamathkm/FTNet.