Große, komplexe und realistische Sicherheitskleidung- und Helm-Erkennung: Datensatz und Methode

Die Erkennung von Sicherheitskleidung und Helmen ist entscheidend für die Sicherheit von Baustellenarbeitern. Die Entwicklung von Deep-Learning-Modellen in diesem Bereich ist jedoch durch die Knappheit hochwertiger Datensätze beeinträchtigt. In dieser Studie erstellen wir einen großen, komplexen und realistischen Datensatz für die Erkennung von Sicherheitskleidung und Helmen (SFCHD). Der SFCHD-Datensatz stammt aus zwei echten chemischen Anlagen und umfasst 12.373 Bilder, sieben Kategorien und 50.552 Annotationen. Wir teilen den SFCHD-Datensatz im Verhältnis 4:1 in Trainings- und Testdatensätze auf und validieren dessen Nützlichkeit durch die Anwendung mehrerer klassischer Objekterkennungsalgorithmen. Darüber hinaus leiten wir uns von räumlichen und kanalbasierten Aufmerksamkeitsmechanismen inspirieren und entwerfen eine räumlich- und kanalbasierte, auf Aufmerksamkeit basierende Modul für die Verbesserung von Bildern bei schlechten Lichtverhältnissen (SCALE). SCALE ist ein plug-and-play-Komponente mit hoher Flexibilität. Umfassende Evaluationen des SCALE-Moduls auf den Datensätzen ExDark und SFCHD haben empirisch dessen Wirksamkeit bei der Verbesserung der Detektionsergebnisse unter schlechten Lichtbedingungen nachgewiesen. Der Datensatz und der Quellcode sind öffentlich unter https://github.com/lijfrank-open/SFCHD-SCALE verfügbar.