HyperAIHyperAI
il y a 2 mois

ESRGAN : Réseaux de Génération Adversariaux Améliorés pour la Super-Résolution

Xintao Wang; Ke Yu; Shixiang Wu; Jinjin Gu; Yihao Liu; Chao Dong; Chen Change Loy; Yu Qiao; Xiaoou Tang
ESRGAN : Réseaux de Génération Adversariaux Améliorés pour la Super-Résolution
Résumé

Le Super-Resolution Generative Adversarial Network (SRGAN) est une œuvre pionnière capable de générer des textures réalistes lors du suréchantillonnage d'une seule image. Cependant, les détails hallucinés sont souvent accompagnés d'artefacts désagréables. Pour améliorer davantage la qualité visuelle, nous avons mené une étude approfondie des trois composants clés du SRGAN : l'architecture du réseau, la perte adversariale et la perte perceptuelle, en apportant des améliorations à chacun d'eux pour obtenir un SRGAN amélioré (ESRGAN). En particulier, nous introduisons le bloc dense résiduel dans le résiduel (Residual-in-Residual Dense Block, RRDB) sans normalisation par lots comme unité de base du réseau. De plus, nous empruntons l'idée des GAN relativistes pour permettre au discriminateur de prédire la réalité relative plutôt que la valeur absolue. Enfin, nous améliorons la perte perceptuelle en utilisant les caractéristiques avant l'activation, ce qui peut fournir une supervision plus forte pour la cohérence de luminosité et la restitution des textures. Grâce à ces améliorations, l'ESRGAN proposé atteint une qualité visuelle constamment supérieure avec des textures plus réalistes et naturelles que le SRGAN et a remporté le premier prix du défi PIRM2018-SR. Le code est disponible sur https://github.com/xinntao/ESRGAN .

ESRGAN : Réseaux de Génération Adversariaux Améliorés pour la Super-Résolution | Articles de recherche récents | HyperAI