Command Palette
Search for a command to run...
Grâce À Une Accélération De 252 Fois, Stanford, UCLA Et d'autres Institutions Ont Utilisé LSTM Pour Faire Entrer Les Simulations Optiques Non Linéaires Du Second Ordre Dans l'ère De La milliseconde.

L'optique non linéaire du second ordre est la branche la plus importante et la plus utilisée de l'optique non linéaire. Elle étudie principalement les effets optiques dominés par la polarisabilité non linéaire du second ordre χ⁽²⁾ lorsque des lasers puissants interagissent avec des cristaux optiques spéciaux dépourvus de symétrie d'inversion centrale. En termes simples,Lorsqu'un faisceau laser de haute intensité pénètre dans ce type de cristal, les photons subissent une « fusion d'énergie et une recombinaison de fréquence », générant directement un faisceau lumineux d'une fréquence et d'une couleur totalement nouvelles.Cela permet des transformations non linéaires classiques telles que la génération de seconde harmonique (GSH), la génération de fréquence somme (GFS) et la génération de fréquence différence (GFD). Dans la recherche optique moderne,L'optique non linéaire du second ordre constitue un fondement physique essentiel pour des domaines tels que l'information quantique, les puces photoniques intégrées, l'imagerie biomédicale et les systèmes laser de haute puissance.
Actuellement, la recherche théorique sur les processus optiques non linéaires du second ordre est assez mature, mais il existe encore d'importants obstacles à leur mise en œuvre pratique, tant sur le plan de l'ingénierie que sur le plan expérimental.D'une part, le coût de la puissance de calcul est élevé.Les algorithmes de simulation traditionnels basés sur la transformée de Fourier doivent calculer avec précision les variations d'oscillation dans les champs optiques ultrarapides et utiliser la méthode de Fourier à pas fractionnés (SSFM) pour simuler la transmission segmentée de la lumière dans le milieu. De ce fait, les simulations numériques requièrent une puissance de calcul considérable. Dans des applications en temps réel, comme les expériences laser à haute cadence de répétition, ce problème s'accentuera avec la demande croissante de contrôle adaptatif et d'optimisation des paramètres en temps réel.
En revanche, ce modèle est déconnecté de la réalité.Les modèles physiques traditionnels sont idéalisés et peinent à prendre en compte les facteurs d'instabilité du monde réel, tels que les erreurs expérimentales, le bruit environnemental et la dérive des systèmes. Leur manque de flexibilité les empêche de s'adapter aux conditions réelles, ce qui engendre un décalage entre les résultats expérimentaux et les applications pratiques. Par ailleurs, le développement croissant des jumeaux numériques optiques et de la co-simulation de chaînes non linéaires multiniveaux a rendu indispensables dans l'industrie de nouveaux outils combinant simulation en temps réel et capacités de liaison expérimentale.
En réponse, des équipes de l'Université de Stanford, de l'UCLA et du SLAC National Accelerator Laboratory, inspirées par des recherches antérieures sur l'application des réseaux neuronaux récurrents (RNN) à la propagation d'impulsions par fibre optique,Nous proposons un modèle de substitution basé sur des réseaux de mémoire à long terme (LSTM), qui peut prédire le champ lumineux de sortie du SFG rapidement et avec précision, tout en réduisant considérablement les coûts de calcul.Le modèle a été entraîné à l'aide de l'ensemble de données de simulation SSFM généré à partir du modèle laser de bout en bout piloté par photocathode LCLS-II (Linac Coherent Light Source II) dans le laboratoire SLAC.Comparativement aux modèles traditionnels, la vitesse de calcul est multipliée par 252.Cela a permis de jeter les bases techniques importantes pour l'optimisation en temps réel des systèmes laser, la modélisation par fusion de données et les jumeaux numériques.
Les résultats connexes, intitulés « Modélisation assistée par apprentissage profond pour l'optique non linéaire χ⁽²⁾ », ont été publiés dans Advanced Photonics.
Points saillants de la recherche :
* L'extension des modèles d'apprentissage profond aux systèmes dynamiques polarimétriques optiques non linéaires du second ordre à champs multiples entièrement couplés améliore considérablement la vitesse de calcul, la flexibilité et l'applicabilité de la modélisation optique non linéaire.
* En exécutant le programme sur un seul GPU NVIDIA A100 avec une taille de lot de 200, le temps d'inférence d'un seul échantillon a été réduit à 7,43 millisecondes, soit une amélioration de 252 fois par rapport au modèle SSFM.
Ces travaux de recherche comblent le fossé entre la simulation numérique et les applications expérimentales pratiques, ouvrant de nouvelles perspectives de recherche pour la conception de systèmes photoniques efficaces, évolutifs et intelligents.

Adresse du document :
https://go.hyper.ai/5bLoA
Construction d'un ensemble de données de simulation haute fidélité pour l'optique non linéaire χ⁽²⁾
L'ensemble de données utilisé dans cette étude repose sur un modèle de simulation complet du système laser à photocathode de la source cohérente de l'accélérateur linéaire LCLS-II du laboratoire SLAC. Ce système comprend une source laser infrarouge à modes verrouillés de 1 035 nm, un conformateur spectral programmable, un amplificateur d'impulsions chirpées et un module de conversion de fréquence non linéaire (comme illustré sur la figure a). Afin de couvrir une large gamme de profils d'impulsions,L'étude a généré 10 000 configurations de mise en forme d'impulsions en échantillonnant aléatoirement les paramètres de dispersion du second ordre, de dispersion du troisième ordre et de mise en forme de l'amplitude spectrale.Pas moins de 400 configurations utilisant uniquement la mise en forme de phase ont été étudiées. Chaque configuration a ensuite fait l'objet d'une simulation de haute précision à l'aide de la méthode SSFM, ce qui a permis d'obtenir trois points de données de champ optique couplés sur 100 tranches de transmission dans le cristal non linéaire : SHG1, SFG et SHG2, avec un nombre de points d'échantillonnage de champ unique de 32 768.

Lors de l'étape de prétraitement des données, l'étude a adopté un processus en trois étapes (comme illustré dans la figure b ci-dessus) : la première étape tronque et sous-échantillonne le champ optique dans le domaine fréquentiel, réduisant le champ optique SFG à 348 valeurs complexes et les deux champs optiques SHG à 1 892 valeurs complexes respectivement ; la deuxième étape concatène les parties réelles et imaginaires de chaque champ optique pour former un vecteur à valeurs réelles d'une longueur fixe de 8 264 éléments ; la troisième étape normalise tous les éléments du vecteur dans l'intervalle [0,1] en fonction des valeurs extrêmes de l'ensemble de données global.L'ensemble de données final a été divisé en 890 000 échantillons d'entraînement, 10 000 échantillons de validation et 90 000 échantillons de test.
Construction d'une architecture de modèle proxy de séquence basée sur LSTM
Le modèle LSTM utilise une architecture séquence à séquence, traitant chaque tranche discrète du cristal non linéaire comme un pas de temps.Ce réseau comporte 2 048 unités cachées, suivies de trois couches entièrement connectées de dimensions respectives (2 048, 4 096), (4 096, 4 096) et (4 096, 8 264). Ces trois couches utilisent les fonctions d’activation ReLU, Tanh et Sigmoïde, comme illustré dans la figure ci-dessous.

Diagramme d'architecture et de processus du réseau
Le modèle LSTM est optimisé à l'aide de l'optimiseur Adam et de la fonction de perte d'erreur quadratique moyenne pondérée (wMSE), comme illustré dans la figure ci-dessous :

Lors de l'entraînement, le modèle LSTM utilise une séquence de 10 coupes spatiales comme entrée pour prédire la coupe suivante. Pour chaque ensemble de données simulées contenant 100 coupes, 100 ensembles d'échantillons entrée-sortie sont générés par glissement d'une fenêtre sur la séquence. Les 9 premiers ensembles sont ajoutés au début de la séquence d'entrée afin d'assurer une longueur d'entrée uniforme. La forme finale du tenseur d'entrée pour l'entraînement est (taille du lot, 10, 8264), et la forme du tenseur de sortie est (taille du lot, 8264).
Le modèle LSTM utilise une approche autorégressive pour l'inférence.Tout d'abord, la première tranche est répétée 10 fois comme première entrée. Ensuite, le modèle LSTM prédit la tranche suivante et l'ajoute à la fin de la séquence d'entrée, en ignorant la première tranche et en conservant une longueur de fenêtre d'entrée de 10. Ce processus est répété cycliquement pour compléter la dérivation pour les 100 étapes spatiales. À partir des résultats de prédiction du modèle séquentiel, l'évolution de l'ensemble des grandeurs physiques du champ à l'intérieur du cristal non linéaire est entièrement reconstituée.
La précision et l'efficacité sont toutes deux améliorées, avec une accélération de 252 fois par rapport à la simulation de référence.
Pour évaluer les performances d'inférence du modèle LSTM,L'étude utilise un indice d'erreur complet qui prend en compte à la fois la morphologie de la forme d'onde et la sensibilité énergétique totale.Cet indice complet comprend trois composantes sans dimension : la similarité cosinus de la forme d’onde normalisée par la surface, qui est inversée et mise à l’échelle pour garantir une erreur nulle lorsque les formes d’onde sont parfaitement identiques ; l’erreur quadratique moyenne normalisée (NMSE) calculée sur la base de l’intensité intégrale totale et proportionnelle à l’énergie, utilisée pour pénaliser les différences d’énergie ; et la distance de Wasserstein (distance du déplaceur de terre, EMD) entre les deux ensembles de courbes de distribution d’intensité, qui permet de détecter avec précision la redistribution locale de l’intensité.
précision de la reconstruction de la forme d'onde
Concernant le dispositif expérimental, le réseau LSTM a convergé après environ 180 époques d'entraînement sur un seul GPU NVIDIA A10G, pour une durée d'entraînement d'environ 160 heures. Les pertes finales d'entraînement et de validation ont atteint respectivement 2,05 × 10⁻⁵ et 2,03 × 10⁻⁵. La méthode d'évaluation a consisté à calculer l'indice d'erreur combiné entre les résultats de prédiction et les résultats de la simulation SSFM.
Concernant les résultats expérimentaux, afin de présenter visuellement les effets qualitatifs, l'étude a tracé des histogrammes et des statistiques des indices d'erreur d'intensité temporelle combinés pour SFG, SHG1 et SHG2, respectivement. Deux ensembles de données de test ont été sélectionnés aléatoirement parmi les quatre quartiles de la distribution d'erreur de SFG. Les courbes d'intensité prédites et réelles de SFG et de son homologue SHG1 dans les domaines temporel et fréquentiel sont présentées, comme illustré dans la figure ci-dessous :

Les deux séries d'images ci-dessous présentent deux exemples supplémentaires issus du quartile supérieur de la distribution des erreurs, illustrant les performances du modèle LSTM sous différentes conditions de mise en forme. Les résultats montrent que les indices d'erreur combinés pour les deux modèles sont respectivement de 0,012 et 0,003. Dans les deux cas,Les modèles LSTM permettent de reconstruire avec précision les signaux SFG et SHG1 dans le domaine fréquentiel ou temporel. Le signal SHG1 ne présente une déviation locale que lorsque l'amplitude de modulation spectrale est importante.Ces exemples démontrent que le modèle LSTM peut atteindre une bonne généralisation dans diverses conditions de mise en forme spectrale.


Efficacité de calcul du modèle
La figure ci-dessous montre le temps d'inférence du modèle LSTM sous différents matériels : la simulation de base est basée sur le modèle SSFM, où SSFM résout les principaux termes gourmands en temps lors de la résolution de la propagation non linéaire.Plus précisément, sur un processeur monocœur, la simulation complète prend 1,98 seconde, tandis que l'opération SSFM prend environ 1,875 seconde. Le modèle LSTM prend à peu près le même temps que la simulation de référence sur un processeur monocœur, en raison de la surcharge liée au traitement par lots ; cependant, sur un seul GPU NVIDIA A100 avec une taille de lot de 200, le temps d'inférence d'un seul échantillon n'est que de 7,43 millisecondes, soit 252 fois plus rapide que la simulation de référence.

Conclusion
Cette étude s'appuie sur des expériences antérieures et intègre plusieurs idées novatrices, notamment un système d'évaluation composite trois-en-un combinant la similarité en cosinus inverse, l'erreur quadratique moyenne normalisée (NMSE) et la décomposition modale empirique (EMD). Ce système remplace l'indice unique traditionnel, inadapté à l'évaluation visuelle et pratique des effets de diverses morphologies d'impulsions et échelles d'énergie, et confère ainsi aux résultats expérimentaux une fiabilité et une crédibilité accrues.
Bien entendu, le principal avantage des LSTM réside dans leur capacité à transformer radicalement le modèle SSFM traditionnel, qui exige des transformations répétées dans le domaine temps-fréquence, engendrant des coûts de calcul élevés. Les LSTM, quant à elles, apprennent directement la relation de transformation dans le domaine fréquentiel simplifié, éliminant ainsi le besoin de transformations de Fourier successives et permettant un calcul en temps réel. De plus, outre les processus SFG, les modèles LSTM peuvent être appliqués à divers scénarios optiques non linéaires du second ordre, offrant un large potentiel d'application et répondant aux besoins des applications expérimentales et pratiques actuelles.
Enfin, la validation réussie du modèle LSTM révèle une fois de plus la grande efficacité des modèles d'apprentissage automatique dans le domaine de la simulation optique non linéaire, brisant les barrières entre la simulation numérique pure et les expériences physiques, et fournissant un nouveau paradigme technique pour la conception de systèmes optoélectroniques efficaces, à grande échelle et intelligents.








