BargainNet : Traduction de domaine guidée par le fond pour l'harmonisation d'images

La composition d’images est une opération fondamentale dans le domaine du traitement d’images. Toutefois, un déséquilibre entre le premier plan et le fond dégrade la qualité de l’image composite. L’harmonisation d’images, qui consiste à ajuster le premier plan afin d’améliorer la cohérence visuelle, est une tâche essentielle mais difficile. Les méthodes précédentes basées sur l’apprentissage profond se concentrent principalement sur l’apprentissage direct de la correspondance entre une image composite et une image réelle, tout en ignorant le rôle crucial de guidance que joue le fond. Dans ce travail, en supposant que le premier plan doit être transformé vers le même domaine que le fond, nous formulons la tâche d’harmonisation comme une translation de domaine guidée par le fond. Par conséquent, nous proposons un réseau d’harmonisation d’images intégrant un nouvel extracteur de code de domaine et des pertes en triplets spécifiquement conçues, capables de capturer les informations de domaine du fond afin de guider l’harmonisation du premier plan. Des expériences étendues sur les benchmarks existants d’harmonisation d’images démontrent l’efficacité de la méthode proposée. Le code source est disponible à l’adresse suivante : https://github.com/bcmi/BargainNet.