L'Université De Princeton Lance Un Contrôleur D'ia Pour Prédire Le Risque De Déchirure Du Plasma 300 Millisecondes À L'avance

Sous la double pression d'une demande énergétique croissante et de l'approche de l'échéance de la « neutralité carbone », l'application d'énergies propres à faibles émissions de carbone, voire à zéro émission de carbone, constitue la tendance générale. Ces dernières années, la fusion nucléaire, qui a le potentiel de produire de l’électricité sans aucune émission de carbone, a reçu une attention accrue et de plus en plus de chercheurs et d’experts ont commencé à mener des recherches approfondies.
Malgré le succès remarquable des expériences de fusion Tokamak, des obstacles subsistent, la perturbation du plasma étant l’un des problèmes les plus critiques qui doivent être résolus pour le bon fonctionnement à impulsions longues d’ITER. La raison principale est que le plasma est très facile à « déchirer » et à échapper au champ magnétique puissant utilisé pour le confiner, provoquant ainsi l’interruption de la réaction de fusion.
Dans des études précédentes, il a été possible de maintenir l’énergie de fusion pendant une courte période. De nos jours, la technologie d’apprentissage par renforcement profond (DRL) ayant montré des performances élevées dans les problèmes de conduite non linéaires et de grande dimension, les gens ont commencé à explorer son introduction dans la recherche sur la fusion nucléaire.Il n'y a pas longtemps, des chercheurs de l'Université de Princeton ont développé un contrôleur d'IA pour la prédiction et le contrôle adaptatifs, qui peut prédire le risque potentiel de déchirure du plasma 300 millisecondes à l'avance et intervenir à temps. Les résultats pertinents ont été publiés dans « Nature ».

Adresse du document :
https://www.nature.com/articles/s41586-024-07024-9
Suivez le compte officiel et répondez « fusion nucléaire » pour télécharger l'article complet
Combiner les méthodes de physique traditionnelles avec l'IA
Comme le montre la figure ci-dessous, les chercheurs ont intégré des méthodes traditionnelles basées sur la physique avec des techniques d’IA avancées pour améliorer le contrôle et la compréhension du comportement du plasma.

Figure a :Système de diagnostic, montrant les principaux outils de diagnostic utilisés dans cette étude pour surveiller et analyser le plasma à l'intérieur du tokamak DIII-D.
Il s'agit notamment du magnétisme pour mesurer les champs magnétiques, de la diffusion Thomson (TS) pour mesurer les distributions de densité et de température, et de la spectroscopie de recombinaison par échange de charge (CER) pour mesurer la température et les débits ioniques. Le mode d'instabilité de déchirure spécifique m/n = 2/1 est mis en évidence en orange sur la figure pour souligner son importance.
Figure b :Actionneurs de chauffage, de commande de courant et de contrôle, montrant des systèmes permettant de chauffer le plasma, de le traverser en courant et de contrôler son comportement.
Il s’agit notamment d’équipements permettant d’injecter des faisceaux de particules, d’appliquer des champs magnétiques et d’utiliser des ondes micro-ondes ou radiofréquences pour le chauffage et le pilotage du courant électrique. Les actionneurs de contrôle jouent un rôle clé dans la manipulation du plasma pour atteindre les conditions souhaitées tout en luttant contre les situations instables comme le mode de déchirure m/n = 2/1.
Figure c :Un système de contrôle pour éviter la déchirure, un système de contrôle pour prévenir ou atténuer les instabilités de déchirure sont présentés.
Dans son étape de prétraitement, les signaux du système de diagnostic sont traités en données structurées de même dimension et résolution spatiale grâce à la reconstruction de profil et à l'ajustement à l'équilibre (EFIT), puis introduits dans le modèle de réseau neuronal profond (DNN).
Figure d:Le contrôleur d'IA basé sur un réseau neuronal profond détermine la puissance globale du faisceau et la forme du plasma.
Un algorithme d'ajustement d'équilibre (EFIT) gère les tâches de contrôle de bas niveau, en ajustant le courant de la bobine magnétique et la puissance du faisceau pour satisfaire les commandes de contrôle de l'IA et les contraintes prédéfinies par l'utilisateur, telles que le maintien d'un facteur de sécurité spécifique (q95) et du couple du faisceau.
Algorithmes d'apprentissage par renforcement : contrôle anti-déchirure
Dans un réacteur à fusion, l’état du plasma est représenté sur la figure suivante :

La ligne noire du panneau a montre que lorsque la pression du plasma est augmentée par un chauffage externe (comme un faisceau de particules neutres), une limite de stabilité est finalement atteinte. Lorsque cette limite est dépassée, des instabilités de déchirure sont excitées. Les figures b et c montrent qu'une fois l'instabilité de déchirure excitée, le plasma sera rapidement détruit, ce qui peut entraîner de graves conséquences en fonctionnement réel.
En s'appuyant sur des réseaux neuronaux profonds et sur l'apprentissage par renforcement, les chercheurs ont développé un système de contrôle intelligent capable de réagir aux changements d'état du plasma en temps réel, de prédire l'état futur du plasma et d'ajuster les actions de contrôle en conséquence, de sorte que le fonctionnement du tokamak suive le chemin idéal et évite les instabilités de déchirure tout en maintenant une pression élevée.

Les modèles d’apprentissage par renforcement utilisent une fonction de récompense pour mettre en œuvre ce problème d’évitement d’obstacles. Le modèle dynamique utilisé pour prédire les futures instabilités de déchirure s'intègre à la bibliothèque OpenAI Gym, lui permettant d'interagir avec le contrôleur en tant qu'environnement d'entraînement. Le contrôleur d'évitement des déchirures est formé à l'aide d'une méthode de gradient de politique déterministe profonde implémentée dans Keras-RL.
L'avantage de l'apprentissage par renforcement est la possibilité d'entrer dans la région βN supérieure via des contrôleurs multi-actionneurs (faisceau et forme) et multi-objectifs (faible déchirure et βN élevé) tout en maintenant une déchirure tolérable.
Contrôle des larmes en DIII-D : traditionnel ou IA
Limites du contrôle par rétroaction traditionnel
Une tentative a été faite pour maintenir la pression plasmatique normalisée (βN = 2,3) par des méthodes de contrôle par rétroaction conventionnelles. Cependant, dans l'expérience n° 193273 (ligne noire sur la figure ci-dessous), lorsque le temps a atteint 2,6 secondes, une grande instabilité de déchirure s'est produite, entraînant une dégradation irréversible de βN.Finalement, l’interruption du plasma s’est produite à 3,1 secondes.
Avantages du contrôle de l'IA
Dans l'expérience n° 193280 (ligne bleue dans la figure ci-dessous), le contrôle IA a été utilisé pour contrôler de manière adaptative la puissance du faisceau et les trois angles de plasma afin de garantir que le degré de déchirure prévu ne dépasse pas le seuil de 0,5.
Les résultats expérimentaux montrent que le degré de déchirure estimé est maintenu avec succès en dessous d’un seuil donné grâce au contrôle de l’IA. Par rapport à l'expérience 193273, un degré de déchirure inférieur peut être obtenu.

Stratégies de contrôle sous différents seuils de déchirure

Les chercheurs ont comparé les stratégies de contrôle sous différents seuils de déchirure. Les numéros d'expérience 193277 (ligne grise dans la figure ci-dessus), 193280 (ligne bleue dans la figure ci-dessus) et 193281 (ligne rouge dans la figure ci-dessus) correspondent à des expériences de contrôle avec des seuils de déchirure de 0,2, 0,5 et 0,7 respectivement.
Dans les cas de k = 0,5 et k = 0,7, le plasma présente une bonne stabilité avant la fin de la période de plateau prédéterminée. Le contrôleur avec un seuil plus élevé (k = 0,7) a tendance à augmenter βN de manière plus agressive dans les premières étapes de l'expérience (t < 3,5 s), mais cela amène le plasma à entrer dans une région plus instable par la suite.
Le contrôleur de seuil inférieur avec k = 0,2 était trop conservateur au début de l'expérience et supprimait excessivement la possibilité d'instabilité. Jusqu'à t = 5 secondes, l'IA a maintenu un degré de déchirure très faible (moins de 0,2), mais a soudainement montré une instabilité inévitable à t = 5,5 secondes.
En revanche, le contrôleur avec un seuil moyen (k = 0,5) est capable de maintenir la stabilité du plasma jusqu'à la fin de la période de plateau et éventuellement de restaurer à nouveau βN.Cela suggère qu’un seuil optimal est nécessaire pour maintenir un plasma stable pendant une longue période.
La quête du Saint Graal de l'énergie propre se heurte encore à de nombreux défis
La réalisation de la fusion nucléaire contrôlée est l’un des objectifs les plus ambitieux de la science et de l’ingénierie modernes et est considérée comme le Saint Graal de l’énergie propre. Quand les humains seront-ils capables de détenir ce Saint Graal, et quel rôle l’IA y jouera-t-elle ?
Cette recherche a démontré avec succès le potentiel de l’IA dans le contrôle efficace des réactions de fusion. De plus, Jaemin, le premier auteur de cet article, a également utilisé de manière innovante des méthodes d'apprentissage par renforcement alors qu'il poursuivait un doctorat au Département de génie nucléaire de l'Université nationale de Séoul pour concevoir un nouvel algorithme de contrôle du plasma pour KSTAR (Korea Superconducting Tokamak Advanced Research Facility).

Bien que de plus en plus de chercheurs aient commencé à mener des recherches approfondies sur la fusion nucléaire et se rapprochent pas à pas de ce Saint Graal, il reste encore de nombreux obstacles techniques à surmonter :
1. Stabilité du plasma :
Le contrôle de la stabilité du plasma à haute température est l’un des principaux défis pour parvenir à une fusion nucléaire contrôlée. Le plasma doit être maintenu à une température et une pression suffisamment élevées pour maintenir le taux de réaction de fusion nécessaire, ce qui nécessite une technologie de contrôle du champ magnétique extrêmement précise.
2. Questions matérielles :
Actuellement, il n’existe aucun matériau capable de résister à une exposition prolongée à des températures élevées et à un flux ionique élevé sans dégradation significative. L’irradiation neutronique peut rendre les matériaux plus fragiles et dégrader leurs performances, ce qui constitue un problème majeur pour le fonctionnement à long terme et l’économie du réacteur.
3. Capture et conversion d’énergie :
La manière de capturer efficacement l’énergie des réactions de fusion et de la convertir en énergie électrique est également au centre des recherches actuelles. Des systèmes de conversion de chaleur en électricité hautement efficaces sont essentiels pour parvenir à une énergie de fusion économiquement viable.
4. Production et approvisionnement en combustible de fusion :
Le tritium et le deutérium peuvent subir des réactions de fusion nucléaire et sont utilisés comme combustible de fusion nucléaire contrôlée. Bien que le deutérium soit relativement abondant dans la nature, le tritium est extrêmement rare. Il est extrêmement difficile de le préparer artificiellement et doit être produit à l’intérieur du réacteur par capture de neutrons ou obtenu par d’autres méthodes. Un kilogramme de tritium vaut plus de 100 millions de dollars.
Ces dernières années, l'IA a apporté trop de surprises dans la recherche scientifique, de la prédiction efficace de la structure des protéines par AlphaFold, au rendu d'images de trous noirs basé sur l'apprentissage automatique, en passant par la prédiction des changements météorologiques basée sur les réseaux neuronaux...
Aujourd’hui, le problème difficile de la stabilité du plasma a été surmonté par l’IA, qui a accumulé de l’expérience pour l’application de l’IA dans le processus de recherche de la fusion nucléaire contrôlée. Je crois que d’autres défis mentionnés ci-dessus seront également surmontés grâce à l’exploration continue des chercheurs !