Nature Journal | Une Équipe Conjointe Tsinghua-MIT Propose Un Cadre De Planification Urbaine Intelligente Basé Sur De Grands Modèles Linguistiques

Face à des systèmes urbains de plus en plus complexes et à des besoins sociaux diversifiés, les méthodes traditionnelles d'urbanisme atteignent des limites. Aujourd'hui, l'intelligence artificielle (IA) apporte une innovation disruptive à ce domaine ancien et crucial.
Récemment, une équipe interdisciplinaire composée de chercheurs d'institutions de premier plan telles que le Center for Urban Science and Computational Research, School of Architecture, Department of Electronic Engineering, Tsinghua University, Massachusetts Institute of Technology (MIT) Senseable City Lab et Northeastern University aux États-Unis a publié un article de point de vue dans la revue internationale de pointe Nature Computational Science.Pour la première fois, un cadre de planification de ville intelligente piloté par un grand modèle de langage (LLM) est systématiquement proposé.Ce cadre intègre en profondeur les puissantes capacités de calcul, de raisonnement et de génération de l’IA avec l’expérience professionnelle et la créativité des planificateurs humains.Son objectif est de faire de l'IA un « assistant de planification intelligent » pour les humains, de relever conjointement les défis complexes de l'urbanisme moderne et d'ouvrir un nouveau paradigme de collaboration homme-machine pour parvenir à un processus de conception urbaine plus efficace, innovant et réactif.
L'évolution et les goulots d'étranglement de l'urbanisme
La théorie et la pratique de l'urbanisme sont en constante évolution, depuis l'accent initial mis sur l'espace physique et la forme esthétique en tant que « conception artistique » jusqu'à l'approche de la « planification scientifique » de l'après-Seconde Guerre mondiale, qui considère l'urbanisme comme un système complexe et utilise des modèles scientifiques pour l'analyser. Cependant, ces approches sont aujourd'hui confrontées à de nouveaux défis : d'une part, le processus de planification reste centré sur l'urbaniste, avec une participation publique limitée. D'autre part, l'évaluation des propositions d'urbanisme est souvent qualitative, subjective et différée, ce qui complique la prise de décisions scientifiques et quantitatives et la rapidité des itérations.
Ces dernières années, les modèles d'IA traditionnels, tels que les réseaux antagonistes génératifs (GAN) et l'apprentissage par renforcement (RL), ont commencé à être appliqués à l'urbanisme, démontrant leur potentiel pour générer des réseaux de rues et un zonage fonctionnel. Cependant, ces modèles sont généralement conçus pour des tâches spécifiques et ont une portée limitée, ce qui les rend incapables de faire face à la complexité interdisciplinaire croissante de l'urbanisme moderne.L’émergence des grands modèles de langage (LLM), avec leurs puissantes capacités d’intégration des connaissances, de raisonnement logique et de génération multimodale, a apporté une opportunité historique de briser ce goulot d’étranglement.
Un nouveau processus de planification urbaine piloté par LLM
Compte tenu des lacunes des méthodes traditionnelles,L’équipe de recherche a proposé de manière innovante un cadre en boucle fermée composé de trois étapes principales : la conception conceptuelle (conceptualisation), la génération de solutions (génération) et l’évaluation des effets (évaluation).Le cadre est piloté de manière collaborative par un grand modèle de langage, un grand modèle visuel (VLM) et un grand agent de modèle (agent LLM), fournissant aux planificateurs humains une assistance intelligente tout au long du processus.

Conception conceptuelle : le LLM devient un « consultant en planification » doté de connaissances interdisciplinaires
Lors de la phase initiale de planification, les planificateurs saisissent des informations textuelles telles que les exigences, les contraintes et les directives. Le LLM, préformé sur des volumes massifs de données, peut intégrer en profondeur des connaissances issues de multiples domaines, notamment la géographie, la société et l'économie, et engager de multiples dialogues avec les planificateurs.Il peut non seulement proposer des idées conceptuelles innovantes, mais aussi raisonner sur la base de contextes complexes pour générer des textes de description de planification détaillés et des esquisses préliminaires de concepts spatiaux.L’efficacité et la profondeur de l’étape de conception conceptuelle ont été grandement améliorées.

Génération de solutions : VLM devient un « concepteur visuel » et transforme le texte en plans
Le cadre utilise des macromodèles visuels (VLM) pour transformer des concepts textuels abstraits en solutions concrètes de conception urbaine visuelle.Les urbanistes peuvent décrire avec précision les concepts et les contraintes d'urbanisme grâce à des instructions textuelles (invites). Affiné à partir des données d'urbanisme, VLM peut générer des rendus visuels détaillés, tels que l'aménagement du territoire, les contours des bâtiments et même des scènes urbaines tridimensionnelles réalistes, tout en garantissant la conformité de la conception aux contraintes réelles, notamment géographiques.

Évaluation : les agents LLM construisent une « ville virtuelle » pour prévisualiser la vie future
Afin d'évaluer scientifiquement les schémas d'urbanisme, le cadre introduit des agents LLM pour effectuer des simulations dynamiques urbaines.Les chercheurs ont attribué aux agents différentes caractéristiques démographiques (comme l'âge et la profession) et leur ont demandé de simuler les déplacements quotidiens et l'utilisation des installations des résidents au sein de la ville virtuelle générée. L'analyse de ces comportements simulés leur a permis d'obtenir des indicateurs d'évaluation quantitative portant sur plusieurs dimensions, notamment la distance de déplacement, l'utilisation des installations, les émissions de carbone et l'équité sociale. Ces données ont fourni un retour d'information scientifique et prospectif pour l'optimisation itérative des solutions d'aménagement.

Premiers succès : l'IA montre son potentiel pour surpasser les experts humains
Afin de vérifier la faisabilité des fonctionnalités clés du cadre, le Centre de recherche en sciences urbaines et en informatique du Département d'électronique de l'Université Tsinghua a publié en continu une série de modèles urbains intermodaux langagiers-visuels tels que CityGPT, CityBench et UrbanLLaVA, ainsi que des plateformes de simulation urbaine incarnée et des systèmes de simulation sociale tels qu'UrbanWord, EmbodiedCity et AgentSociety, posant ainsi les bases techniques de l'urbanisme et de la gouvernance sociale à l'ère des grands modèles. Pour l'urbanisme à l'ère du LLM, l'équipe de recherche a mené une série d'expériences de vérification de concepts. Lors d'un test, les chercheurs ont demandé au LLM de répondre aux questions de l'examen de qualification professionnelle d'urbaniste. Les résultats ont montré queLe LLM à plus grande échelle surpasse les 101 meilleurs planificateurs humains TP3T pour répondre à des questions de concept de planification complexes, démontrant son grand potentiel au stade de la conceptualisation.
Durant la phase d'évaluation, l'équipe a utilisé un agent LLM pour simuler les visites des résidents dans deux quartiers de New York et de Chicago. Les résultats de la simulation ont montré que les points chauds de l'agent correspondaient étroitement aux données réelles de mobilité des résidents, démontrant ainsi la précision et l'efficacité de l'agent LLM pour prédire l'impact réel des propositions d'urbanisme.

Défis et perspectives : construire une future ville de collaboration homme-machine
L'équipe de recherche a enfin souligné que ce cadre ne vise pas à remplacer les planificateurs humains, mais plutôt à établir un nouveau flux de travail pour la collaboration homme-machine. Grâce à ce modèle, les planificateurs peuvent se libérer des fastidieuses tâches de traitement de données et de dessin et se concentrer davantage sur l'innovation, les considérations éthiques et la communication avec les différentes parties prenantes.L’IA est responsable de l’achèvement efficace de l’intégration des concepts, de la génération de solutions et de l’évaluation de la simulation.
L'article identifie également les défis auxquels cette approche technique est confrontée, notamment la rareté des données d'urbanisme de qualité, les énormes besoins en ressources informatiques et les biais géographiques et sociaux potentiels des modèles. Les recherches futures nécessiteront la mise en place de plateformes de données ouvertes, le développement de modèles spécialisés plus performants et la conception d'algorithmes d'équité afin de garantir que l'IA puisse servir tous les environnements urbains de manière équitable et inclusive.
Nous pouvons nous attendre à ce que dans un avenir proche, les urbanistes soient en mesure de concevoir des villes efficaces, vivables et durables plus rapidement et mieux avec l’aide de puissants assistants d’IA, libérant pleinement la créativité humaine pour façonner notre maison urbaine commune.
Lien vers l'article :
https://www.nature.com/articles/s43588-025-00846-1
À propos de l'auteur
L'auteur principal de l'article est Zheng Yu, doctorant au département de génie électronique de l'université Tsinghua. Les auteurs correspondants sont le professeur Li Yong du département de génie électronique, le professeur adjoint Lin Yuming de l'école d'architecture de l'université Tsinghua et le professeur associé Qi R. Wang du département de génie environnemental de l'université Northeastern. Parmi les collaborateurs figurent le professeur adjoint Xu Fengli du département de génie électronique de l'université Tsinghua, ainsi que les chercheurs Paolo Santi et Carlo Ratti du MIT Senseable City Lab.