Command Palette
Search for a command to run...
ConstructionSite-Baustellenbilddatensatz
Date
Size
Paper URL
License
Non-Commercial
ConstructionSite ist ein multimodaler Benchmark-Datensatz für Baustellenszenen, der 2025 von der University of British Columbia und der University of British Columbia veröffentlicht wurde. Die zugehörigen Ergebnisse des Papiers lauten:Sind große, vortrainierte Vision-Language-Modelle effektive Sicherheitsinspektoren für den Bau?“, dessen Ziel es ist, das Bildverständnis und die Argumentationsfähigkeiten von Vision-Language-Modellen in Bausicherheitsumgebungen zu bewerten und zu verbessern.
Dieser Datensatz enthält 10.013 Bilder von Baustellen, aufgeteilt in einen Trainingsdatensatz mit 7.009 Bildern und einen Testdatensatz mit 3.004 Bildern. Jeder Datensatz enthält ein Bild, eine Bildbeschreibung, eine Frage und Antwort zu Sicherheitsverstößen, Anmerkungen zum Begrenzungsrahmen des verletzenden Objekts, spezifische Kategorien für Objekterkennungsaufgaben (wie Bagger, Bewehrungsstahl und Arbeiter mit weißen Schutzhelmen) sowie Bildattribute wie Beleuchtung, Kameraabstand, Blickwinkel und Informationsqualität. Dieser Datensatz enthält komplexe Szenen, vielfältige Anmerkungen und kommt tatsächlichen Sicherheitsinspektionen auf Baustellen sehr nahe. Er eignet sich für Aufgaben wie Bildbeschreibung, visuelle Frage- und Antwortbeantwortung, Objekterkennung, visuelle Lokalisierung und multimodales Denken.
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.