KITTI-Datensatz Zur Auswertung Von Computer-Vision-Algorithmen
Datum
Größe
Veröffentlichungs-URL
Lizenz
CC BY-NC-SA 3.0
Kategorien
KITTI ist ein Satz von Auswertungsdatensätzen für Computer-Vision-Algorithmen, der hauptsächlich für entsprechende Tests in Szenarien des autonomen Fahrens verwendet wird. Die Auswertungsarten umfassen Stereobilder, optischen Fluss, visuelle Entfernungsmessung, 3D-Objekterkennung und 3D-Tracking. KITTI enthält echte Bilddaten, die aus Szenen wie städtischen Gebieten, ländlichen Gebieten und Autobahnen gesammelt wurden. Jedes Bild enthält bis zu 15 Fahrzeuge und 30 Fußgänger und weist unterschiedliche Grade der Okklusion und Beschneidung auf.
Der Datensatz besteht aus 389 Paaren von Stereobildern und optischen Flusskarten, 39,2 km visuellen Entfernungssequenzen und mehr als 200.000 3D-annotierten Objektbildern und wird mit 10 Hz abgetastet und synchronisiert. Der ursprüngliche Datensatz ist in fünf Kategorien unterteilt: „Straße“, „Stadt“, „Wohngebiet“, „Campus“ und „Person“, während die 3D-Objekterkennung in Auto, Lieferwagen, LKW, Fußgänger, Fußgänger (sitzend), Radfahrer, Straßenbahn und Sonstiges unterteilt ist.
Der KITTI-Datensatz wurde 2013 gemeinsam vom Karlsruher Institut für Technologie in Deutschland und dem Toyota Research Institute of America veröffentlicht. Das zugehörige Dokument trägt den Titel „Vision meet Robotics: The KITTI Dataset“.