HyperAIHyperAI

L'apprentissage Par Renforcement Profond Permet d'optimiser La Protection Contre Les Incendies En Milieu urbain. Une Équipe De l'Académie Chinoise Des Sciences a Proposé Une Nouvelle Méthode DRL Pour Résoudre Le Problème De Configuration Des installations.

特色图像

Dans la construction et l'aménagement urbains, l'optimisation géospatiale est cruciale. Elle joue un rôle clé dans tous les aspects, du choix de l'emplacement des parcs industriels à l'aménagement des infrastructures de services publics. Cependant, les solutions traditionnelles présentent de nombreuses limites. Aujourd'hui, l'apprentissage profond offre de nouvelles opportunités.

Récemment, lors de la réunion académique annuelle 2025 du Comité d'analyse des modèles géographiques et des informations géographiques de la Société géographique chinoise,Le Dr Liang Haojian de l'Institut d'innovation en information spatiale de l'Académie chinoise des sciences a donné une présentation sur le thème de « l'optimisation géospatiale » intitulée « Recherche sur la méthode d'optimisation de la configuration des installations d'incendie d'urgence urbaine basée sur l'apprentissage par renforcement profond hiérarchique ».Il fournit également une introduction détaillée sous quatre aspects : un aperçu des problèmes d'optimisation géospatiale, des recherches sur les méthodes d'apprentissage en profondeur pour les problèmes d'optimisation géospatiale, de nouvelles explorations basées sur l'apprentissage par renforcement profond hiérarchique et des perspectives d'avenir.

HyperAI a compilé et résumé les propos approfondis de M. Liang Haojian sans en compromettre l'intention initiale. Voici la transcription de son discours.

Optimisation géospatiale : intégration approfondie des mathématiques et de la géographie

L'optimisation géospatiale est une combinaison d'optimisation combinatoire mathématique et de science de l'information géographique. Elle vise à résoudre des problèmes pratiques tels que l'aménagement du territoire et l'allocation des ressources. Elle revêt une importance majeure pour la recherche dans de nombreux domaines, tels que la construction urbaine, la sélection de sites de parcs industriels et d'installations de services publics.Cela peut être exprimé comme un problème d’optimisation impliquant des variables de décision, des contraintes et une fonction objective.Les variables de décision sont généralement des entiers ou des variables 0-1, comme illustré dans la figure ci-dessous.

Où 𝒙 est la variable de décision, 𝒈(x) est la contrainte d'inégalité, 𝒉(𝒙) est la contrainte d'égalité et 𝒇 𝒙 est la fonction objective
La contrainte (1) représente la plage de la variable de décision 𝒙, qui est généralement un entier ou une variable 0-1.

Prenons comme exemple le problème classique de la p-médiane :Elle vise à sélectionner p installations de déploiement parmi les installations candidates afin de minimiser la distance totale entre tous les points de demande et l'installation la plus proche, et est souvent utilisée dans la sélection des sites d'installations publiques. Il existe trois types de méthodes traditionnelles pour résoudre les problèmes d'optimisation spatiale : les algorithmes exacts, les algorithmes approximatifs et les algorithmes heuristiques, mais elles présentent toutes leurs propres inconvénients.

* L'algorithme précis peut obtenir la solution optimale globale,Cependant, la complexité de calcul est généralement élevée et le temps de résolution augmente de façon exponentielle avec la taille du problème.Par exemple, la méthode de branchement et de liaison, la programmation dynamique, etc.
* Les algorithmes approximatifs améliorent l’efficacité de la solution tout en garantissant certaines performances théoriques.Cependant, la conception de son algorithme est relativement complexe.Par exemple, les stratégies gourmandes, l’arrondi de la programmation linéaire et d’autres méthodes.
* Les algorithmes heuristiques peuvent obtenir de meilleures solutions en moins de temps et conviennent aux problèmes complexes à grande échelle.Cependant, il manque une garantie d’optimalité théorique.Les méthodes courantes incluent le recuit simulé, la recherche tabou, etc.

L'apprentissage profond entre dans l'optimisation géospatiale

Dans des domaines tels que la vision par ordinateur et le traitement du langage naturel, les modèles profonds ont remplacé la conception manuelle d'algorithmes et ont obtenu des résultats remarquables. Peut-on alors les utiliser pour résoudre des problèmes d'optimisation spatiale ? Partant de cette idée, les chercheurs ont exploré l'optimisation spatiale neuronale, avec trois motivations : apprendre des méthodes heuristiques plus rapides et plus performantes, utiliser une approximation rapide basée sur les données pour remplacer les calculs complexes, concevoir automatiquement un cadre général pour de nouveaux algorithmes heuristiques et entraîner des modèles DRL avec des informations historiques pour orienter la planification future.

J'ai donc deux idées majeures pour NeurSPO :

L’une est une structure profonde.En termes simples, la solution est vide au début, puis un point est sélectionné à chaque fois jusqu'à ce que les points cibles p soient sélectionnés pour terminer la construction étape par étape de la solution.

Le deuxième est l’amélioration de la profondeur.Son essence est similaire à celle d'algorithmes tels que la recherche locale, une méthode d'amélioration des solutions. L'apprentissage profond peut être utilisé pour remplacer des solutions. Par exemple, dans la recherche locale, les points appropriés peuvent être sélectionnés pour être échangés ou optimisés.

Modèle SpoNet : l'attention de superposition dynamique résout le problème de sélection de site

Comment résoudre les problèmes cibles de p-médiane, p-centre et MCLP en explorant les méthodes DRL ? Nous avons d'abord testé le modèle d'information et d'attention à couverture dynamique.Un cadre unifié pour résoudre les problèmes de sélection de sites, SpoNet, est proposé.Sa structure se compose principalement de 3 parties :

* Dans le cadre du modèle d'apprentissage profond, l'agent interagit en permanence avec l'environnement et maximise la récompense grâce à une grande quantité d'essais et d'erreurs et de stratégies d'apprentissage, sans avoir besoin de générer des informations d'étiquette.

* Le modèle d’attention permet au modèle d’apprendre à se concentrer sur des parties spécifiques de la séquence d’entrée lors du décodage, plutôt que de s’appuyer uniquement sur l’entrée du décodeur.

* Lors de la couverture d'un nœud, si un nœud a été couvert, le choix de déployer des installations à ce stade peut réduire l'efficacité de la couverture. Dans le modèle d'attention à la couverture dynamique, les coordonnées de localisation statiques de la ville et l'état de couverture dynamique entre les villes sont codés. Grâce à l'introduction d'informations de couverture spécifiques au problème pour le codage, le modèle améliore sa capacité à comprendre les relations de couverture spatiale, accélérant ainsi le processus de résolution. Comme le montre la figure suivante :

Processus de base pour résoudre le problème de sélection de sites de couverture maximale basé sur un modèle d'attention de couverture dynamique
Modèle d'attention de couverture dynamique

Nous avons appliqué ce modèle pour étudier l'optimisation de l'aménagement des installations d'urgence du district de Chaoyang, à Pékin, et avons sélectionné un ensemble de données de 132 installations d'urgence. Nous avons supposé que la distance de service maximale de chaque point d'installation était de 2 kilomètres.Finalement, 20 points ont été sélectionnés comme pôles centraux parmi 132 installations d’urgence candidates, qui couvraient le plus grand nombre de nœuds.

AIAM : Modèle d'attention interactive adaptative pour résoudre le problème p-médian

L'algorithme de recherche locale, qui consiste à rechercher une meilleure solution au voisinage de la solution actuelle, est relativement mature. C'est pourquoi nous avons exploré la recherche auxiliaire par amélioration profonde.Autrement dit, sur la base de l'idée de recherche de voisinage, la stratégie de recherche DRL est utilisée pour réaliser un processus de recherche d'approximation rapide qui remplace les calculs complexes.

Dans le problème de planification de chemin, il existe différentes relations d'ordre entre les différents nœuds, mais la solution du problème 𝒑-médiane est un sous-ensemble de l'ensemble des installations, ce qui entraîne des relations de distribution différentes entre les nœuds utilisateurs et les points d'installation. Pour mesurer cette relation de distribution, nous avons mis en place l'interaction entre « utilisateur » et « installation » et proposé un modèle d'attention adaptative à l'interaction.

Le modèle se compose de trois parties : un encodeur d'attention interactif, un décodeur de suppression de nœud et un décodeur d'insertion de nœud.Comme le montre la figure suivante :

Modèle d'attention adaptative interactive

Éprouvé,Le modèle a pu retenir 15 hôpitaux sur 2 162 localités (sites de demande) et 80 hôpitaux (sites d’établissements candidats).La distance totale entre les zones résidentielles et les hôpitaux est minimisée, ce qui prouve la faisabilité du modèle AIAM dans des scénarios pratiques.

Les DRL en couches résolvent le problème de la configuration des installations de lutte contre les incendies d'urgence en milieu urbain

À l'heure actuelle, les villes se développent rapidement, la fréquence et la complexité des situations d'urgence ne cessent d'augmenter, et les problèmes d'équilibre entre efficacité et fonctionnalité des installations d'urgence urbaines de lutte contre l'incendie s'intensifient. Les méthodes traditionnelles de prévision des incendies sont difficiles à gérer avec des données à grande échelle et de haute précision, ce qui entraîne une faible précision de l'évaluation des risques, des délais d'intervention et une configuration des installations de lutte contre l'incendie incapable de refléter en temps réel les évolutions urbaines et les besoins d'urgence. Dans ce contexte, il est urgent de mettre en place des systèmes intelligents et dynamiques de prévision des risques d'incendie et des installations d'urgence afin d'améliorer considérablement la scientificité et l'efficacité de la prévention, du contrôle et de la gestion des incendies en milieu urbain.

Sur cette base,Nous orientons la recherche théorique des cadres d’apprentissage profond vers des applications réelles.Afin d'améliorer la prévention et le contrôle des incendies en milieu urbain, ainsi que les capacités d'intervention d'urgence, la recherche se concentre sur l'amélioration de la précision des prévisions des risques d'incendie, l'optimisation de l'allocation des ressources d'urgence et l'amélioration de la rapidité et de la flexibilité des interventions d'urgence. Cet objectif est atteint grâce aux trois axes suivants.

Le premier est l’exploration et la fusion de caractéristiques spatio-temporelles multidimensionnelles pour la prédiction des risques d’incendie urbain.

Le réseau neuronal spatio-temporel pour la prévision du risque d'incendie urbain est principalement composé d'un module d'extraction de caractéristiques spatio-temporelles et d'un module de sortie de fusion. * Le module d'extraction de caractéristiques spatio-temporelles capture automatiquement les changements dynamiques de la structure spatiale urbaine, de la répartition des installations de lutte contre l'incendie, des statistiques d'incendie et des données météorologiques dans la propagation vers l'avant ; * Le module de sortie de fusion intègre les caractéristiques spatio-temporelles grâce au mécanisme d'attention et génère finalement la valeur de prédiction du risque d'incendie. Comme illustré dans la figure ci-dessous.

Composition du réseau neuronal spatio-temporel

La deuxième consiste à construire un modèle d’optimisation pour la configuration des installations de protection incendie d’urgence en tenant compte de l’incertitude et des pertes dues aux catastrophes.

Lors de la sélection d'un site multi-couverture, des facteurs incertains tels que la fréquence des incendies, les conditions de circulation et la répartition de la demande sont introduits, et les pertes dues aux catastrophes sont intégrées à la fonction objective afin d'améliorer la robustesse du plan d'aménagement. L'évolution de la fréquence des incendies, du flux de circulation et des fluctuations de la demande est décrite par une distribution de probabilité ou une estimation d'intervalle. Lors de la modélisation, le risque d'incendie est combiné aux données historiques et aux conditions géographiques pour construire un modèle probabiliste. La réponse du trafic est basée sur la distribution temporelle de la capacité de trafic et une analyse de simulation. L'évolution de la demande est répliquée au développement dynamique de la ville en définissant une plage de fluctuation ou un ensemble de scénarios.

La troisième est la méthode DRL hiérarchique pour optimiser la disposition des installations de lutte contre l’incendie d’urgence.

L'algorithme adopte une stratégie hiérarchique pour coordonner la disposition générale et les ajustements locaux des installations de protection incendie. L'état du modèle inclut la répartition des installations, le risque d'incendie et les conditions de circulation, et l'action consiste à établir une station ou à prendre une décision de planification à chaque instant.

Perspectives d'avenir : repousser les limites et poursuivre l'innovation

La recherche scientifique progresse constamment. À l'avenir, notre équipe prévoit d'explorer des problèmes d'optimisation géospatiale plus complexes et plus pratiques grâce à une collaboration interdisciplinaire, combinant systèmes d'information géographique, méthodes d'optimisation mathématique et technologies d'apprentissage profond.

À cet égard, j’ai formulé quelques réflexions et perspectives à partir des trois aspects suivants :

* Introduire un mécanisme de calcul géographique pour améliorer la capacité de perception spatiale.

La capacité de l'IA à optimiser l'espace géographique est encore à l'étude, et les recherches actuelles sont loin d'être suffisantes. À l'avenir, la modélisation de mécanismes spatiaux tels que le terrain, l'accessibilité des réseaux et la connectivité contribuera à améliorer la capacité du modèle à expliquer les structures géographiques et son adaptabilité pratique.

* Élargi aux problèmes d’intervention d’urgence à grande échelle et transrégionaux.

À l'heure actuelle, nos recherches se limitent à l'exploration de petits problèmes, donc à l'avenir elles s'étendront inévitablement progressivement à l'exploration de problèmes d'intervention d'urgence à grande échelle, et continueront à l'améliorer pour soutenir l'optimisation des liens multicentriques aux niveaux de l'agglomération urbaine et provincial, afin d'améliorer l'évolutivité, la stabilité et l'efficacité informatique de la méthode.

* Concevoir un cadre d’algorithme DRL plus efficace.

À l’avenir, nous pourrons continuer à explorer et à optimiser le mécanisme de coordination des stratégies de haut/bas niveau et le processus de formation, introduire des technologies telles que la collaboration multi-agents, la formation asynchrone et les mécanismes causaux, et parvenir à une résolution plus efficace des problèmes pratiques.

En résumé, la méthode DRL hiérarchique proposée par l'équipe du Dr Liang Haojian de l'Institut d'innovation en information spatiale de l'Académie chinoise des sciences est une solution d'innovation en IA dans le domaine de l'optimisation géospatiale.En intégrant le modèle d'attention de couverture dynamique, le modèle d'attention interactif adaptatif et la technologie de fusion de caractéristiques spatio-temporelles multidimensionnelles, il résout non seulement les problèmes d'évaluation des risques retardés et d'allocation inefficace des ressources dans l'aménagement des installations de lutte contre l'incendie traditionnelles, mais réalise également la coordination globale et l'optimisation locale de l'aménagement des installations d'urgence grâce à une stratégie en couches.

À l'avenir, avec l'introduction de mécanismes de calcul géographique et l'expansion des modèles d'intervention d'urgence interrégionaux, cette méthode devrait libérer un potentiel accru dans les domaines de la gouvernance urbaine à grande échelle et de l'optimisation des liens multicentriques, et favoriser une intégration et une innovation approfondies entre l'optimisation de l'espace géographique et la gestion des urgences. L'exploration et l'innovation continues devraient permettre à l'optimisation de l'espace géographique de réaliser de nouvelles avancées et de renforcer le soutien au développement urbain et à la gestion des urgences.

À propos de l'Institut d'innovation en information spatiale de l'Académie chinoise des sciences

Le Dr Liang Haojian est assistant de recherche spécial à l'Institut d'innovation en matière d'information spatiale de l'Académie chinoise des sciences.Les principales orientations de recherche sont l'optimisation géospatiale, l'apprentissage par renforcement profond, l'analyse des données volumineuses de télédétection et l'application complète de la Terre numérique.

M. Liang Haojian

Son équipe, dirigée par le chercheur Wang Shaohua, a pour vision de « promouvoir l'application croisée des sciences géospatiales et de l'intelligence artificielle afin de proposer des solutions innovantes pour la réalisation des villes intelligentes et des objectifs de développement durable ». Elle s'engage à utiliser des méthodes de calcul avancées et des technologies d'intelligence artificielle pour analyser et traiter les mégadonnées spatio-temporelles afin de parvenir à une prise de décision intelligente et à une optimisation de l'environnement spatial.L'équipe a utilisé des technologies telles que l'analyse de données volumineuses spatio-temporelles, l'apprentissage profond et l'apprentissage automatique pour mener un certain nombre d'études telles que l'optimisation géospatiale et l'IA de télédétection.

Le professeur Wang Shaohua et son équipe

L'apprentissage Par Renforcement Profond Permet d'optimiser La Protection Contre Les Incendies En Milieu urbain. Une Équipe De l'Académie Chinoise Des Sciences a Proposé Une Nouvelle Méthode DRL Pour Résoudre Le Problème De Configuration Des installations. | Actualités | HyperAI