FDFlowNet : estimation rapide du flux optique à l’aide d’un réseau profond léger

Des progrès significatifs ont été réalisés dans l'estimation du flux optique à l'aide de réseaux neuronaux profonds. Les modèles profonds avancés parviennent à estimer le flux avec une grande précision, mais souvent au prix d'une complexité computationnelle élevée et de processus d'entraînement longs. Dans ce travail, nous proposons un modèle léger mais efficace pour l'estimation en temps réel du flux optique, nommé FDFlowNet (fast deep flownet). Notre modèle atteint une précision égale ou supérieure aux résultats les plus récents sur les benchmarks exigeants KITTI et Sintel, tout en étant environ deux fois plus rapide que PWC-Net. Ce gain de performance est obtenu grâce à une architecture soigneusement conçue et à des composants nouvellement introduits. Nous proposons tout d'abord un réseau en forme de U pour construire des caractéristiques multi-échelles, offrant aux niveaux supérieurs un champ réceptif global, contrairement aux réseaux pyramidaux traditionnels. À chaque échelle, nous introduisons une structure partiellement connectée à convolution dilatée, qui permet un meilleur compromis entre vitesse, précision et nombre de paramètres, par rapport aux architectures entièrement connectées séquentielles ou denses. Les expériences montrent que notre modèle atteint des performances de pointe tout en restant rapide et léger.