Command Palette
Search for a command to run...
ConstructionSite-Baustellenbilddatensatz
Datum
Größe
Paper-URL
Lizenz
Nicht-kommerziell
*Dieser Datensatz unterstützt die Online-Nutzung.Klicken Sie hier, um zu springen.
ConstructionSite ist ein multimodaler Benchmark-Datensatz für Baustellenszenen, der 2025 von der University of British Columbia und der University of British Columbia veröffentlicht wurde. Die zugehörigen Ergebnisse des Papiers lauten:Sind große, vortrainierte Vision-Language-Modelle effektive Sicherheitsinspektoren für den Bau?“, dessen Ziel es ist, das Bildverständnis und die Argumentationsfähigkeiten von Vision-Language-Modellen in Bausicherheitsumgebungen zu bewerten und zu verbessern.
Dieser Datensatz enthält 10.013 Bilder von Baustellen, aufgeteilt in einen Trainingsdatensatz mit 7.009 Bildern und einen Testdatensatz mit 3.004 Bildern. Jeder Datensatz enthält ein Bild, eine Bildbeschreibung, eine Frage und Antwort zu Sicherheitsverstößen, Anmerkungen zum Begrenzungsrahmen des verletzenden Objekts, spezifische Kategorien für Objekterkennungsaufgaben (wie Bagger, Bewehrungsstahl und Arbeiter mit weißen Schutzhelmen) sowie Bildattribute wie Beleuchtung, Kameraabstand, Blickwinkel und Informationsqualität. Dieser Datensatz enthält komplexe Szenen, vielfältige Anmerkungen und kommt tatsächlichen Sicherheitsinspektionen auf Baustellen sehr nahe. Er eignet sich für Aufgaben wie Bildbeschreibung, visuelle Frage- und Antwortbeantwortung, Objekterkennung, visuelle Lokalisierung und multimodales Denken.
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.