Virtueller KITTI-Synthetischer Videodatensatz
Datum
Größe
Veröffentlichungs-URL
Lizenz
CC BY-NC-SA 3.0
Kategorien

Virtual KITTI ist ein fotorealistischer synthetischer Videodatensatz zum Lernen und Bewerten von Computervisionsmodellen für mehrere Aufgaben zum Verständnis von Videos: Objekterkennung und Multiobjektverfolgung, semantische Segmentierung auf Szenen- und Instanzebene, optischer Fluss und Tiefenschätzung.
Der Datensatz enthält 50 hochauflösende Monokularvideos (21.260 Bilder), die aus fünf verschiedenen virtuellen Welten in städtischen Umgebungen unter unterschiedlichen Bild- und Wetterbedingungen generiert wurden. Diese Welten wurden mit der Unity-Spiel-Engine und einer neuartigen Methode zum Klonen von realen zu virtuellen Welten erstellt.
Die synthetischen Videos werden automatisch, präzise und umfassend für die 2D- und 3D-Mehrobjektverfolgung mit Kategorie-, Instanz-, Fluss- und Tiefenanmerkungen auf Pixelebene annotiert.