HyperAIHyperAI
vor 2 Monaten

Tiefe mehrskalige Faltungsneuronale Netzwerke für die Entverwischung dynamischer Szenen

Seungjun Nah; Tae Hyun Kim; Kyoung Mu Lee
Tiefe mehrskalige Faltungsneuronale Netzwerke für die Entverwischung dynamischer Szenen
Abstract

Die nicht-uniforme blinden Entverwischung für allgemeine dynamische Szenen ist ein anspruchsvolles Problem der Computer Vision, da Verwischungen nicht nur durch mehrere Objektbewegungen, sondern auch durch Kamerawackel und Tiefenunterschiede in der Szene entstehen. Um diese komplexen Bewegungsverwischungen zu entfernen, basieren herkömmliche Energieoptimierungsverfahren auf einfachen Annahmen, wie zum Beispiel, dass das Verwischungskernel teilweise uniform oder lokal linear ist. Zudem hängen moderne maschinelles Lernen-basierte Methoden von synthetischen Verwischungsdatensätzen ab, die unter diesen Annahmen generiert werden. Dies führt dazu, dass herkömmliche Entverwischungsverfahren bei Verwischungen versagen, bei denen das Verwischungskernel schwer zu approximieren oder zu parametrisieren ist (z.B. an den Rändern von bewegten Objekten). In dieser Arbeit schlagen wir ein mehrstufiges Faltungsneuronales Netzwerk vor, das scharfe Bilder in einem End-to-End-Prozess wiederherstellt, unabhängig davon, welche Quellen die Verwischung verursacht haben. Zudem präsentieren wir eine mehrstufige Fehlerfunktion (loss function), die herkömmliche grob-zu-feine Ansätze nachahmt. Des Weiteren stellen wir einen neuen großen Datensatz vor, der realistische verwischte Bilder und die entsprechenden scharfen Referenzbilder enthält, die mit einer Hochgeschwindigkeitskamera aufgenommen wurden. Anhand des vorgeschlagenen Modells, das auf diesem Datensatz trainiert wurde, zeigen wir empirisch, dass unsere Methode sowohl qualitativ als auch quantitativ den aktuellen Stand der Technik in der Entverwischung dynamischer Szenen erreicht.