Ensemble De Données Vidéo Synthétiques Virtuelles KITTI
Date
Taille
URL de publication
Licence
CC BY-NC-SA 3.0
Catégories

Virtual KITTI est un ensemble de données vidéo synthétiques photoréalistes pour l'apprentissage et l'évaluation de modèles de vision par ordinateur pour de multiples tâches de compréhension vidéo : détection d'objets et suivi multi-objets, segmentation sémantique au niveau de la scène et de l'instance, flux optique et estimation de la profondeur.
L'ensemble de données contient 50 vidéos monoculaires haute résolution (21 260 images) générées à partir de cinq mondes virtuels différents dans des environnements urbains sous différentes conditions d'imagerie et météorologiques. Ces mondes ont été créés à l'aide du moteur de jeu Unity et d'une nouvelle méthode de clonage réel-virtuel.
Les vidéos synthétiques sont annotées automatiquement, avec précision et de manière exhaustive pour le suivi multi-objets 2D et 3D avec des annotations de catégorie, d'instance, de flux et de profondeur au niveau du pixel.