Command Palette
Search for a command to run...
Ensemble De Données d'images De Chantier De Construction ConstructionSite
Date
Size
Paper URL
License
Non-Commercial
ConstructionSite est un ensemble de données de référence multimodales pour les scènes de chantiers de construction publié par l'Université de la Colombie-Britannique et l'Université de la Colombie-Britannique en 2025. Les résultats de l'article associé sont "Les grands modèles de langage visuel pré-entraînés sont-ils efficaces pour les inspecteurs de sécurité de la construction ?", qui vise à évaluer et à améliorer les capacités de compréhension d'image et de raisonnement des modèles vision-langage dans les environnements de sécurité de la construction.
Cet ensemble de données contient 10 013 images de chantier, réparties en un ensemble d'apprentissage de 7 009 images et un ensemble de test de 3 004 images. Chaque entrée de données comprend une image, sa description, une question/réponse sur les violations des règles de sécurité, des annotations de l'objet en infraction dans le cadre de délimitation, des catégories spécifiques pour les tâches de détection d'objets (comme les excavatrices, les barres d'armature et les ouvriers portant des casques blancs), ainsi que des attributs d'image tels que l'éclairage, la distance de la caméra, l'angle de vue et la qualité de l'information. Cet ensemble de données présente des scènes complexes, des annotations variées et est proche des inspections de sécurité réelles sur le chantier. Il est adapté à des tâches telles que la description d'images, la réponse visuelle aux questions, la détection d'objets, la localisation visuelle et le raisonnement multimodal.
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.