HyperAIHyperAI
vor 2 Monaten

LAVIB: Eine umfangreiche Benchmark für Video-Interpolation

Alexandros Stergiou
LAVIB: Eine umfangreiche Benchmark für Video-Interpolation
Abstract

Dieses Papier stellt einen großen Benchmark für die Aufgabe der Video-Rahmen-Interpolation (VFI) auf niedriger Ebene vor: den Large-scale Video Interpolation Benchmark (LAVIB). LAVIB umfasst eine große Sammlung hochaufgelöster Videos, die durch einen automatisierten Prozess aus dem Internet gewonnen wurden und nur minimale Anforderungen an menschliche Überprüfung stellen. Für jedes Video werden Metriken bezüglich Bewegungsamplituden, Helligkeitsbedingungen, Bildschärfe und Kontrast berechnet. Die Sammlung von Videos sowie die Erstellung quantitativer Herausforderungen basierend auf diesen Metriken sind in aktuellen Datensätzen für niedrigstufige Videobearbeitungsaufgaben unterrepräsentiert. Insgesamt enthält LAVIB 283.000 Clips aus 17.000 Ultra-HD-Videos, die eine Gesamtdauer von 77,6 Stunden abdecken. Die Trainings-, Validierungs- und Testsets des Benchmarks weisen ähnliche Verteilungen der Video-Metriken auf. Zusätzliche Aufteilungen wurden auch für Herausforderungen außerhalb der Verteilung (Out-of-Distribution, OOD) erstellt, wobei die Trainings- und Testsets Videos mit unterschiedlichen Eigenschaften enthalten.

LAVIB: Eine umfangreiche Benchmark für Video-Interpolation | Neueste Forschungsarbeiten | HyperAI