Command Palette
Search for a command to run...
Une approche unifiée des caractéristiques profondes et conçues à la main à plusieurs échelles pour l'estimation de la profondeur de champ
Une approche unifiée des caractéristiques profondes et conçues à la main à plusieurs échelles pour l'estimation de la profondeur de champ
Park Jinsun Tai Yu-Wing Cho Donghyeon Kweon In So
Résumé
Dans cet article, nous proposons des caractéristiques manuelles robustes et synergiques, ainsi qu’une caractéristique profonde simple mais efficace extraite d’une architecture de réseau de neurones convolutif (CNN) pour l’estimation du flou de mise au point. Nous analysons de manière systématique l’efficacité des différentes caractéristiques, et montrons comment chaque type de caractéristique peut compenser les faiblesses des autres lorsqu’elles sont combinées. Pour une estimation complète de la carte de flou, nous extrayons des patches d’image sur des bords forts de manière éparsse, puis utilisons ces patches pour extraire à la fois des caractéristiques profondes et manuelles. Afin de réduire le degré de dépendance liée à l’échelle des patches, nous proposons également une stratégie d’extraction multi-échelle. Une carte de flou éparsse est générée à l’aide d’un classificateur basé sur un réseau de neurones, suivi d’un filtre bilatéral fondé sur la probabilité. La carte de flou finale est obtenue à partir de la carte éparsse, avec une guidance fournie par une image d’entrée filtrée préservant les contours. Les résultats expérimentaux montrent que notre algorithme surpasse les méthodes de pointe en matière d’estimation du flou de mise au point. Ce travail peut être appliqué à des tâches telles que la segmentation, la放大 du flou (blur magnification), la génération d’images à focale totale (all-in-focus image generation) et l’estimation en 3D.