Ensemble De Données D'évaluation De L'algorithme De Vision Par Ordinateur KITTI
Date
Taille
URL de publication
Licence
CC BY-NC-SA 3.0
Catégories
KITTI est un ensemble de données d'évaluation d'algorithmes de vision par ordinateur, qui est principalement utilisé pour des tests connexes dans des scénarios de conduite autonome. Les types d'évaluation couvrent les images stéréo, le flux optique, la télémétrie visuelle, la détection d'objets 3D et le suivi 3D. KITTI contient des données d'images réelles collectées à partir de scènes telles que des zones urbaines, des zones rurales et des autoroutes. Chaque image comporte jusqu'à 15 véhicules et 30 piétons, et présente différents degrés d'occlusion et de troncature.
L'ensemble de données comprend 389 paires d'images stéréo et de cartes de flux optique, 39,2 km de séquences de télémétrie visuelle et plus de 200 000 images d'objets annotées en 3D, et est échantillonné et synchronisé à 10 Hz. L'ensemble de données d'origine est divisé en cinq catégories : « Route », « Ville », « Résidentiel », « Campus » et « Personne », tandis que la détection d'objets 3D est divisée en voiture, camionnette, camion, piéton, piéton (assis), cycliste, tramway et divers.
L'ensemble de données KITTI a été publié conjointement par l'Institut de technologie de Karlsruhe en Allemagne et le Toyota Research Institute of America en 2013. L'article associé est « Vision meet Robotics: The KITTI Dataset ».