HyperAIHyperAI
il y a 2 mois

Réseau neuronal convolutif multi-échelle profond pour le défloutage de scènes dynamiques

Seungjun Nah; Tae Hyun Kim; Kyoung Mu Lee
Réseau neuronal convolutif multi-échelle profond pour le défloutage de scènes dynamiques
Résumé

Le défloutage non uniforme aveugle pour des scènes dynamiques générales est un problème complexe en vision par ordinateur, car les flous proviennent non seulement de mouvements multiples d'objets, mais aussi de tremblements de la caméra et de variations de profondeur de champ. Pour éliminer ces flous de mouvement complexes, les méthodes traditionnelles basées sur l'optimisation d'énergie reposent sur des hypothèses simplistes, telles que le noyau de flou est partiellement uniforme ou localement linéaire. De plus, les méthodes récentes basées sur l'apprentissage automatique dépendent également de jeux de données synthétiques générés sous ces hypothèses. Cela rend les méthodes traditionnelles inefficaces pour éliminer les flous lorsque le noyau de flou est difficile à approximer ou à paramétrer (par exemple, aux frontières des mouvements d'objets). Dans ce travail, nous proposons un réseau neuronal convolutif multi-échelle qui restaure des images nettes d'une manière bout-en-bout où le flou est causé par diverses sources. Parallèlement, nous présentons une fonction de perte multi-échelle qui imite les approches traditionnelles allant du grossier au fin. De plus, nous proposons un nouveau jeu de données à grande échelle qui fournit des paires d'images réalistes floues et des images nettes correspondantes obtenues par une caméra haute vitesse. Avec le modèle proposé formé sur ce jeu de données, nous démontrons empiriquement que notre méthode atteint les performances les plus avancées dans le défloutage de scènes dynamiques, tant qualitativement que quantitativement.