Une Approche Unifiée des Caractéristiques Multiechelles Profondes et Créées Manuellement pour l'Estimation de la Défocalisation

Dans cet article, nous présentons des caractéristiques manuellement conçues robustes et synergiques ainsi qu'une caractéristique profonde simple mais efficace issue d'une architecture de réseau neuronal convolutif (CNN) pour l'estimation du flou de défocalisation. Cet article analyse systématiquement l'efficacité de différentes caractéristiques et montre comment chaque caractéristique peut compenser les faiblesses des autres caractéristiques lorsqu'elles sont concaténées. Pour une estimation complète de la carte de défocalisation, nous extrayons des patches d'image sur les contours forts de manière éparse, puis nous les utilisons pour l'extraction de caractéristiques profondes et manuellement conçues. Afin de réduire le degré de dépendance à l'échelle des patches, nous proposons également une stratégie d'extraction multi-échelle. Une carte de défocalisation éparse est générée en utilisant un classificateur neuronal suivi d'un filtre bilatéral probabiliste conjoint. La carte de défocalisation finale est obtenue à partir de la carte de défocalisation éparse avec le guidage d'une image d'entrée filtrée préservant les contours. Les résultats expérimentaux montrent que notre algorithme est supérieur aux algorithmes de pointe en termes d'estimation du flou de défocalisation. Notre travail peut être utilisé pour des applications telles que la segmentation, l'amplification du flurring, la génération d'images toutes en focus et l'estimation 3D.