HyperAIHyperAI

Nature Journal | Gemeinsames Team Von Tsinghua Und MIT Schlägt Smart-City-Planungsrahmen Auf Basis Großer Sprachmodelle Vor

vor einem Monat
Lernen Sie AI4S kennen
h.li
特色图像

Angesichts zunehmend komplexer städtischer Systeme und vielfältiger sozialer Bedürfnisse geraten traditionelle Methoden der Stadtplanung an ihre Grenzen. Künstliche Intelligenz (KI) sorgt heute für bahnbrechende Innovationen in diesem alten und wichtigen Bereich.

Kürzlich veröffentlichte ein interdisziplinäres Team aus Wissenschaftlern führender Institutionen wie dem Center for Urban Science and Computational Research, der School of Architecture, der Abteilung für Elektrotechnik, der Tsinghua-Universität, dem Senseable City Lab des Massachusetts Institute of Technology (MIT) und der Northeastern University in den USA einen Standpunktartikel in der internationalen, hochmodernen Fachzeitschrift Nature Computational Science.Zum ersten Mal wird systematisch ein Rahmen für die intelligente Stadtplanung vorgeschlagen, der auf einem großen Sprachmodell (LLM) basiert.Dieses Framework integriert die leistungsstarken Rechen-, Argumentations- und Generierungsfunktionen der KI umfassend mit der Berufserfahrung und Kreativität menschlicher Planer.Ziel ist es, KI in einen „intelligenten Planungsassistenten“ für Menschen zu integrieren, die komplexen Herausforderungen der modernen Stadtplanung gemeinsam anzugehen und ein neues Paradigma der Mensch-Maschine-Zusammenarbeit zu eröffnen, um einen effizienteren, innovativeren und reaktionsschnelleren Stadtgestaltungsprozess zu erreichen.

Die Entwicklung und Engpässe der Stadtplanung

Theorie und Praxis der Stadtplanung entwickeln sich ständig weiter, von der frühen Fokussierung auf physischen Raum und ästhetische Form als „künstlerische Gestaltung“ bis hin zum Ansatz der „wissenschaftlichen Planung“ nach dem Zweiten Weltkrieg, der Stadtplanung als komplexes System betrachtet und wissenschaftliche Modelle zur Analyse nutzt. Diese Ansätze stehen heute jedoch vor neuen Herausforderungen: Einerseits ist der Planungsprozess nach wie vor planerzentriert, mit eingeschränkter Beteiligung der Öffentlichkeit. Andererseits erfolgt die Bewertung von Planungsvorschlägen oft qualitativ, subjektiv und verzögert, was wissenschaftliche, quantitative Entscheidungen und schnelle Iterationen erschwert.

In den letzten Jahren wurden traditionelle KI-Modelle wie Generative Adversarial Networks (GANs) und Reinforcement Learning (RL) zunehmend in der Stadtplanung eingesetzt. Sie zeigten Potenzial bei der Generierung von Straßennetzen und funktionaler Zonierung. Diese Modelle sind jedoch in der Regel für spezifische Aufgaben konzipiert und haben einen engen Anwendungsbereich. Dadurch sind sie der zunehmenden interdisziplinären Komplexität der modernen Stadtplanung nicht gewachsen.Das Aufkommen großer Sprachmodelle (LLMs) mit ihren leistungsstarken Fähigkeiten zur Wissensintegration, zum logischen Denken und zur multimodalen Generierung hat eine historische Chance geboten, diesen Engpass zu überwinden.

Ein neuer Prozess für die Stadtplanung, der von LLM vorangetrieben wird

Angesichts der Mängel traditioneller MethodenDas Forschungsteam schlug auf innovative Weise ein geschlossenes Rahmenwerk vor, das aus drei Kernphasen besteht: Konzeption (Konzeptualisierung), Lösungsgenerierung (Generation) und Wirkungsbewertung (Evaluierung).Das Framework wird gemeinsam von einem großen Sprachmodell, einem großen visuellen Modell (VLM) und einem großen Modellagenten (LLM-Agent) gesteuert und bietet menschlichen Planern während des gesamten Prozesses intelligente Unterstützung.

Ein großes sprachmodellbasiertes Stadtplanungsframework, das LLM, VLM und LLM-Agenten integriert, um einen kollaborativen Workflow für „Konzeptgenerierung und -bewertung“ zu bilden.

Konzeptionelles Design: LL.M. wird zum „Planungsberater“ mit interdisziplinärem Wissen

In der ersten Planungsphase geben die Planer Textinformationen wie Anforderungen, Einschränkungen und Richtlinien ein. LLM, das auf riesigen Datenmengen vortrainiert ist, kann Wissen aus verschiedenen Bereichen, darunter Geographie, Gesellschaft und Wirtschaft, tiefgreifend integrieren und mehrere Dialogrunden mit den Planern führen.Es kann nicht nur innovative konzeptionelle Ideen vorschlagen, sondern auch auf der Grundlage komplexer Zusammenhänge argumentieren, um detaillierte Planungsbeschreibungstexte und vorläufige räumliche Konzeptskizzen zu erstellen.Die Effizienz und Tiefe der Konzeptionsphase wurden erheblich verbessert.

Flussdiagramm für die städtebauliche Konzeptgestaltung basierend auf LLM

Lösungsgenerierung: VLM wird zum „visuellen Designer“ und verwandelt Text in Blaupausen

Das Framework nutzt visuelle Makromodelle (VLMs), um abstrakte Textkonzepte in konkrete, visuelle Lösungen für die Stadtgestaltung umzuwandeln.Planer können Planungskonzepte und -beschränkungen durch Textanweisungen (Eingabeaufforderungen) präzise beschreiben. VLM, optimiert mit Daten aus der Stadtplanung, kann detaillierte visuelle Ergebnisse wie Flächennutzungspläne, Gebäudeumrisse und sogar realistische dreidimensionale Stadtszenen generieren und gleichzeitig sicherstellen, dass der Entwurf realen Einschränkungen wie der Geografie entspricht.

Schematische Darstellung der Stadtplanerstellung

Evaluation: LLM-Agenten bauen eine „virtuelle Stadt“, um einen Ausblick auf das zukünftige Leben zu erhalten

Um Planungsschemata wissenschaftlich zu bewerten, führt das Framework LLM-Agenten ein, um städtische dynamische Simulationen durchzuführen.Die Forscher wiesen den Agenten verschiedene demografische Merkmale (wie Alter und Beruf) zu und ließen sie die täglichen Fahrten und die Nutzung von Einrichtungen innerhalb der generierten virtuellen Stadt simulieren. Durch die Analyse dieser simulierten Verhaltensweisen konnten sie quantitative Bewertungsmaße für mehrere Dimensionen gewinnen, darunter Fahrtdistanz, Nutzung von Einrichtungen, CO2-Emissionen und soziale Gerechtigkeit. Dies lieferte wissenschaftliches und zukunftsorientiertes Feedback für die iterative Optimierung von Planungslösungen.

Bewertungsschema für städtebauliche Effekte basierend auf LLM&VLM-Agent

Frühe Erfolge: KI zeigt Potenzial, menschliche Experten zu übertreffen

Um die Machbarkeit der Kernfunktionen des Frameworks zu überprüfen, hat das Zentrum für Urban Science and Computing Research der Fakultät für Elektronik der Tsinghua-Universität kontinuierlich eine Reihe sprachvisueller, modalübergreifender Stadtmodelle wie CityGPT, CityBench und UrbanLLaVA sowie urbane Simulationsplattformen und soziale Simulationssysteme wie UrbanWord, EmbodiedCity und AgentSociety veröffentlicht und damit die technische Grundlage für Stadtplanung und soziale Governance im Zeitalter großer Modelle gelegt. Für die Stadtplanung im LLM-Zeitalter führte das Forschungsteam eine Reihe von Konzeptverifizierungsexperimenten durch. In einem Test baten die Forscher LLM, Fragen aus der Berufsqualifikationsprüfung für Stadtplaner zu beantworten. Die Ergebnisse zeigten, dassDer LLM im größten Maßstab übertrifft die 101 besten menschlichen Planer des TP3T bei der Beantwortung komplexer Fragen zu Planungskonzepten und zeigt sein großes Potenzial in der Konzeptionsphase.

Während der Evaluierungsphase simulierte das Team mithilfe eines LLM-Agenten die Einrichtungsbesuche von Bewohnern in zwei Gemeinden in New York und Chicago. Die Simulationsergebnisse zeigten, dass die Hotspots des Agenten eng mit den realen Mobilitätsdaten der Bewohner übereinstimmten. Dies belegte die Genauigkeit und Effektivität des LLM-Agenten bei der Vorhersage der tatsächlichen Auswirkungen von Planungsvorschlägen.

LLM erstellt schematische Darstellung städtebaulicher Effekte

Herausforderungen und Perspektiven: Aufbau einer zukünftigen Stadt der Mensch-Maschine-Zusammenarbeit

Das Forschungsteam betonte abschließend, dass dieses Framework nicht darauf abzielt, menschliche Planer zu ersetzen, sondern vielmehr einen neuen Workflow für die Mensch-Maschine-Zusammenarbeit zu etablieren. In diesem Modell können Planer von mühsamen Datenverarbeitungs- und Zeichenaufgaben befreit werden und sich stärker auf Innovation, ethische Überlegungen und die Kommunikation mit verschiedenen Interessengruppen konzentrieren.KI ist für die effiziente Durchführung der Konzeptintegration, Lösungsgenerierung und Simulationsauswertung verantwortlich.

Der Artikel identifiziert auch Herausforderungen dieses technischen Ansatzes, darunter den Mangel an hochwertigen Daten zur Stadtplanung, den enormen Bedarf an Rechenressourcen sowie mögliche geografische und soziale Verzerrungen in den Modellen. Zukünftige Forschung erfordert die Einrichtung offener Datenplattformen, die Entwicklung effizienterer Spezialmodelle und die Entwicklung von Fairness-Algorithmen, um sicherzustellen, dass KI-Technologie allen städtischen Umgebungen gerecht und integrativ dienen kann.

Wir können davon ausgehen, dass Stadtplaner in naher Zukunft mithilfe leistungsstarker KI-Assistenten effizientere, lebenswertere und nachhaltigere Städte schneller und besser entwerfen können und so der menschlichen Kreativität bei der Gestaltung unseres gemeinsamen städtischen Zuhauses freien Lauf lassen können.

Link zum Artikel:

https://www.nature.com/articles/s43588-025-00846-1

Über den Autor

Erstautor des Artikels ist Zheng Yu, Doktorand am Institut für Elektrotechnik der Tsinghua-Universität. Korrespondierende Autoren sind Professor Li Yong vom Institut für Elektrotechnik, Assistenzprofessor Lin Yuming von der Architekturschule der Tsinghua-Universität und außerordentlicher Professor Qi R. Wang vom Institut für Umwelttechnik der Northeastern University. Zu den weiteren Mitarbeitern zählen Assistenzprofessor Xu Fengli vom Institut für Elektrotechnik der Tsinghua-Universität sowie die Forscher Paolo Santi und Professor Carlo Ratti vom MIT Senseable City Lab.