Réinterroger l'approche grossière-fin dans le déflouage d'image unique

Les stratégies grossier-vers-fin ont été largement utilisées dans la conception d'architectures de réseaux de déflouage d'images uniques. Les méthodes classiques consistent généralement à empiler des sous-réseaux prenant en entrée des images à différentes échelles, en améliorant progressivement la netteté des images du sous-réseau inférieur vers le sous-réseau supérieur, ce qui entraîne inévitablement des coûts computationnels élevés. Dans une optique de conception d’un réseau de déflouage rapide et précis, nous revisitons la stratégie grossier-vers-fin et proposons un réseau U à entrées et sorties multiples (MIMO-UNet). Le MIMO-UNet présente trois caractéristiques distinctes. Premièrement, l’encodeur unique du MIMO-UNet prend en entrée des images à plusieurs échelles, ce qui réduit la difficulté d’entraînement. Deuxièmement, le décodeur unique du MIMO-UNet produit plusieurs images déflouées à différentes échelles, imitant ainsi le comportement de réseaux U en cascade multiples à l’aide d’un unique réseau en forme de U. Troisièmement, une fusion asymétrique des caractéristiques est introduite pour combiner efficacement les caractéristiques à plusieurs échelles. Des expériences étendues sur les jeux de données GoPro et RealBlur démontrent que le réseau proposé surpasse les méthodes de pointe en termes de précision et de complexité computationnelle. Le code source est disponible à l’adresse suivante pour des fins de recherche : https://github.com/chosj95/MIMO-UNet.