Estimation non supervisée du noyau de flou et correction pour la super-résolution aveugle
La super-résolution aveugle (blind-SR) est une tâche cruciale en vision par ordinateur, avec de nombreuses applications dans le monde réel. L’estimation du noyau de flou constitue l’élément central de la blind-SR, aux côtés des réseaux de super-résolution adaptatifs, et une estimation plus précise du noyau se traduit par une meilleure performance. Récemment, les réseaux génératifs adversariaux (GAN) basés sur la comparaison de patches à différentes échelles se sont imposés comme les méthodes les plus efficaces pour l’estimation non supervisée du noyau. Toutefois, ces approches souffrent encore de plusieurs limitations. ① Leur capacité à discriminer la netteté est jugée insuffisante, ce qui les pousse à privilégier la forme des motifs plutôt que la netteté des contours. ② Dans certains cas, le processus de correction du noyau est omis, bien qu’il soit essentiel : en effet, un noyau généré de manière optimale peut être plus étroit qu’une fonction de réponse impulsionnelle (PSF), sauf lorsque la PSF correspond à un filtre passe-bas idéal. ③ Les travaux antérieurs n’ont pas pris en compte le fait que les GAN sont également sensibles à l’épaisseur des bords ainsi qu’à la PSF. Dans ce papier, nous proposons donc : 1) un processus de dégradation et de comparaison par classement, conçu pour rendre les modèles GAN plus sensibles à la netteté des images ; 2) une technique de correction de noyau indépendante de l’échelle, basée sur une approximation par noyau gaussien incluant un paramètre d’épaisseur. Pour améliorer davantage la précision du noyau, nous proposons également : 3) un modèle combiné intégrant le GAN proposé et le DIP (Deep Image Prior), afin d’offrir une supervision accrue, ainsi qu’un réseau de correction du noyau permettant la propagation des gradients à travers la méthode de correction proposée. Des expérimentations multiples montrent que nos méthodes améliorent significativement l’erreur L2 et la forme du noyau. En outre, lorsqu’elles sont combinées à des algorithmes classiques de blind-SR, elles atteignent la meilleure précision de reconstruction parmi les méthodes non supervisées d’estimation du noyau de flou.