Ensemble De Données D'images De Bâtiments Urbains CityGen
Date
Taille
URL de publication

Cet ensemble de données provient du documentCityDreamer : Modèle génératif compositionnel de villes 3D illimitées« Les ensembles de données construits comprennent l'ensemble de données OSM et l'ensemble de données Google Earth, et les résultats ont été inclus dans CVPR 2024.
1. Ensemble de données OSM
L'ensemble de données provient d'OpenStreetMap (OSM). Comprend des cartes sémantiques rastérisées et des champs de hauteur pour 80 villes, couvrant une superficie de plus de 6 000 kilomètres carrés. Au cours du processus de rastérisation, les informations de géométrie vectorielle sont converties en une image à l'aide du système de coordonnées EPSG:3857 et zoomées au niveau 18, soit environ 0,597 mètre par pixel.
La carte sémantique utilise différentes couleurs pour représenter des éléments dans différents endroits, tels que le rouge pour les routes, le jaune pour les bâtiments, le vert pour les espaces verts, le cyan pour les chantiers de construction et le bleu pour les zones d'eau. Le champ de hauteur représente principalement la hauteur des bâtiments. La hauteur de la route est fixée à 4, la hauteur de l'eau est fixée à 0 et la hauteur des arbres est échantillonnée aléatoirement entre 8 et 16.
2. Ensemble de données Google Earth
L'ensemble de données a été collecté à partir de Google Earth Studio, en particulier dans les zones de Manhattan et de Brooklyn à New York. Il contient 400 pistes, chaque piste contient 60 images et un total de 24 000 images réelles de villes. Le rayon des voies variait de 125 à 813 mètres et les hauteurs de 112 à 884 mètres. Google Earth Studio fournit les paramètres intrinsèques et extrinsèques de la caméra, permettant de générer des annotations automatiques pour la segmentation sémantique et des instances de construction. Les instances de bâtiments individuels sont identifiées en détectant les composants connectés dans un graphe sémantique et les annotations sont générées en projetant la disposition de la ville sur l'image à l'aide des paramètres de la caméra.
Cohérence multi-vues : cet ensemble de données comprend des images réelles de villes à partir de différents points de vue, ce qui améliore la capacité des réseaux neuronaux à générer des villes à partir de différents points de vue.