DeepDualMapper : Un réseau de fusion à porte pour l'extraction automatique de cartes à partir d'images aériennes et de trajectoires

L’extraction automatique de cartes est d’une importance capitale pour le calcul urbain et les services basés sur la localisation. Les images aériennes et les données de trajectoires GPS représentent deux sources de données distinctes pouvant être exploitées pour générer une carte, bien qu’elles contiennent des types d’informations différents. La plupart des travaux antérieurs sur la fusion de données entre images aériennes et données provenant de capteurs auxiliaires n’exploitent pas pleinement l’information des deux modalités, ce qui entraîne une perte d’information. Nous proposons un réseau neuronal profond à convolution appelé DeepDualMapper, qui fusionne les images aériennes et les données de trajectoires de manière plus fluide afin d’extraire une carte numérique. Nous avons conçu un module de fusion à portes (gated fusion module) afin de contrôler explicitement les flux d’information provenant des deux modalités de manière complémentaire. En outre, nous proposons un décodeur à raffinement fortement supervisé, novateur, permettant de générer les prédictions de manière progressive, du grossier au fin. Nos expériences approfondies démontrent que DeepDualMapper peut fusionner l’information des images et des trajectoires de manière bien plus efficace que les approches existantes, et est capable de produire des cartes avec une précision accrue.