HyperAIHyperAI

Command Palette

Search for a command to run...

LAVIB: Eine umfangreiche Benchmark für Video-Interpolation

Alexandros Stergiou

Zusammenfassung

Dieses Papier stellt einen großen Benchmark für die Aufgabe der Video-Rahmen-Interpolation (VFI) auf niedriger Ebene vor: den Large-scale Video Interpolation Benchmark (LAVIB). LAVIB umfasst eine große Sammlung hochaufgelöster Videos, die durch einen automatisierten Prozess aus dem Internet gewonnen wurden und nur minimale Anforderungen an menschliche Überprüfung stellen. Für jedes Video werden Metriken bezüglich Bewegungsamplituden, Helligkeitsbedingungen, Bildschärfe und Kontrast berechnet. Die Sammlung von Videos sowie die Erstellung quantitativer Herausforderungen basierend auf diesen Metriken sind in aktuellen Datensätzen für niedrigstufige Videobearbeitungsaufgaben unterrepräsentiert. Insgesamt enthält LAVIB 283.000 Clips aus 17.000 Ultra-HD-Videos, die eine Gesamtdauer von 77,6 Stunden abdecken. Die Trainings-, Validierungs- und Testsets des Benchmarks weisen ähnliche Verteilungen der Video-Metriken auf. Zusätzliche Aufteilungen wurden auch für Herausforderungen außerhalb der Verteilung (Out-of-Distribution, OOD) erstellt, wobei die Trainings- und Testsets Videos mit unterschiedlichen Eigenschaften enthalten.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp