Flare-Free Vision: Uformer mit Tiefeninsighten stärken
Bildflare ist ein häufiges Problem, das auftritt, wenn eine Kamera auf eine starke Lichtquelle gerichtet ist. Sie kann sich als Geisterbilder, Überbelichtung oder andere Artefakte äußern, die die Bildqualität beeinträchtigen. Wir stellen einen neuartigen Ansatz basierend auf tiefem Lernen zur Flare-Entfernung vor, der eine Kombination aus Tiefenschätzung und Bildrestaurierung nutzt. Zur Schätzung der Szenentiefe verwenden wir einen Dense Vision Transformer. Dieses Tiefenkarte wird anschließend mit dem Eingabebild verkettet und dem Uformer – einem allgemeinen, U-förmigen Transformer für die Bildrestaurierung – zugeführt. Unser vorgeschlagener Ansatz erreicht state-of-the-art-Leistung auf dem Flare7K++-Testdatensatz und demonstriert somit die Wirksamkeit bei der Beseitigung von Flare-Artefakten aus Bildern. Zudem zeigt unsere Methode Robustheit und Generalisierbarkeit auf realen Bildern mit unterschiedlichen Flare-Typen. Wir sind überzeugt, dass unsere Arbeit neue Möglichkeiten für die Nutzung von Tiefeninformationen in der Bildrestaurierung eröffnet. Der Quellcode ist auf GitHub verfügbar.