Penn-Fudan-Datensatz Zur Fußgängererkennung Und -segmentierung
Datum
Größe
Veröffentlichungs-URL
Kategorien
Der Penn-Fudan-Datensatz zur Fußgängererkennung und -segmentierung wurde gemeinsam von Forschern der University of Pennsylvania und der Fudan University erstellt und wird hauptsächlich für Aufgaben zur Fußgängererkennung verwendet. Dieser Datensatz enthält 170 hochauflösende RGB-Bilder, die aus Videosequenzen aufgenommen wurden, und in jedem Bild sind 0 bis 6 Fußgängerziele vorhanden. Die Position jedes Fußgängers wird durch ein rechteckiges Kästchen (Maske) genau markiert, wodurch Informationen zu den Koordinaten des Begrenzungsrahmens bereitgestellt werden, um das Training und Testen der Objekterkennung zu erleichtern.
Die Dateistruktur des Datensatzes ist wie folgt:
Annotation/
: Enthält die Anmerkungsdateien für jedes Bild.PedMasks/
: Enthält die Fußgängersegmentierungsmaske, die jedem Bild entspricht.PNGImages/
: Enthält alle Bilder im Datensatz.
Die Bilder werden in unterschiedlichen Umgebungen wie Campusgeländen, Straßen, Zebrastreifen usw. gesammelt und decken unterschiedliche Lichtverhältnisse, Fußgängerhaltungen und Okklusionssituationen ab. Insgesamt werden 345 Fußgängerfälle annotiert. Auf jedem Bild ist mindestens ein Fußgänger zu sehen, auf manchen Bildern sind sogar mehrere Fußgänger zu sehen. Alle Bilder sind im PASCAL VOC-Format annotiert, einschließlich genauer Begrenzungsrahmen und Segmentierungsmasken auf Pixelebene für jeden Fußgänger.
