Mit Einer Beschleunigung Um Das 252-fache Haben Stanford, UCLA Und Andere Institutionen LSTM Eingesetzt, Um Nichtlineare Optische Simulationen Zweiter Ordnung in Die Millisekunden-Ära Zu bringen.

vor 3 Stunden

Die nichtlineare Optik zweiter Ordnung ist der wichtigste und am weitesten verbreitete Teilbereich der nichtlinearen Optik. Sie untersucht vor allem die optischen Effekte, die von der nichtlinearen Polarisierbarkeit zweiter Ordnung χ⁽²⁾ dominiert werden, wenn starke Laser mit speziellen optischen Kristallen wechselwirken, denen die zentrale Inversionssymmetrie fehlt. Vereinfacht ausgedrückt:Wenn ein Laserstrahl hoher Intensität in einen solchen Kristall eintritt, erfahren die Photonen eine „Energieverschmelzung und Frequenzrekombination“, wodurch direkt ein Lichtstrahl mit völlig neuer Frequenz und Farbe erzeugt wird.Dies ermöglicht klassische nichtlineare Transformationen wie die Frequenzverdopplung (SHG), die Summenfrequenzerzeugung (SFG) und die Differenzfrequenzerzeugung (DFG). In der modernen optischen ForschungDie nichtlineare Optik zweiter Ordnung ist eine wichtige physikalische Grundlage für Bereiche wie Quanteninformation, integrierte photonische Chips, biomedizinische Bildgebung und Hochleistungslasersysteme.

Die theoretische Forschung zu nichtlinearen optischen Prozessen zweiter Ordnung ist derzeit recht weit fortgeschritten, doch bestehen bei der praktischen Umsetzung in Technik und Experiment noch erhebliche Hürden.Zum einen sind die Kosten für Rechenleistung hoch.Herkömmliche Fourier-basierte Simulationsalgorithmen müssen die Schwingungsänderungen in ultraschnellen optischen Feldern präzise berechnen und zudem die Split-Step-Fourier-Methode (SSFM) zur Simulation des segmentierten Lichtaustritts im Medium verwenden. Dies führt zu einem enormen Rechenaufwand für numerische Simulationen. In Echtzeitszenarien wie Laserexperimenten mit hoher Wiederholrate gewinnt dieses Problem mit dem steigenden Bedarf an adaptiver Regelung und Echtzeit-Parameteroptimierung zunehmend an Bedeutung.

Andererseits hat das Modell keinen Bezug zur Realität.Herkömmliche physikalische Modelle sind idealisiert und können reale Instabilitätsfaktoren wie Messfehler, Umgebungsrauschen und Drift von Anlagensystemen nur schwer abbilden. Ihnen fehlt die Flexibilität, sich an reale Bedingungen anzupassen, was zu einer Diskrepanz zwischen experimentellen Ergebnissen und praktischen Anwendungen führt. Darüber hinaus hat die zunehmende Entwicklung optischer digitaler Zwillinge und mehrstufiger nichtlinearer Ketten-Co-Simulationen neue Werkzeuge, die Echtzeitsimulation mit experimentellen Verknüpfungsmöglichkeiten kombinieren, in der Industrie unerlässlich gemacht.

Als Reaktion darauf haben sich Teams der Stanford University, der UCLA und des SLAC National Accelerator Laboratory, inspiriert von früheren Forschungen zur Anwendung rekurrenter neuronaler Netze (RNNs) auf die Ausbreitung von Glasfaserimpulsen,Wir schlagen ein Ersatzmodell vor, das auf Long Short-Term Memory (LSTM)-Netzwerken basiert und das Ausgabelichtfeld von SFG schnell und genau vorhersagen kann, während gleichzeitig die Rechenkosten deutlich reduziert werden.Das Modell wurde anhand des SSFM-Simulationsdatensatzes trainiert, der aus dem LCLS-II (Linac Coherent Light Source II) Photokathoden-getriebenen Laser-End-to-End-Modell im SLAC-Labor generiert wurde.Im Vergleich zu herkömmlichen Modellen wird die Rechengeschwindigkeit um das 252-fache erhöht.Dies hat eine wichtige technische Grundlage für die Echtzeitoptimierung von Lasersystemen, die Datenfusionsmodellierung und digitale Zwillinge geschaffen.

Die zugehörigen Ergebnisse mit dem Titel „Deep learning-assisted modeling for χ⁽²⁾ nonlinear optics“ wurden in Advanced Photonics veröffentlicht.

Forschungshighlights:

* Die Erweiterung von Deep-Learning-Modellen auf vollständig gekoppelte Mehrfeld-nichtlineare optische polarimetrische Dynamiksysteme zweiter Ordnung verbessert umfassend die Rechengeschwindigkeit, Flexibilität und Anwendbarkeit der nichtlinearen optischen Modellierung.

* Bei einer Batchgröße von 200 auf einer einzelnen NVIDIA A100 GPU konnte die Inferenzzeit für Einzelproben auf 7,43 Millisekunden reduziert werden, was einer 252-fachen Verbesserung gegenüber dem SSFM-Modell entspricht.

Diese Forschung schließt die Lücke zwischen numerischer Simulation und praktischen experimentellen Anwendungen und eröffnet neue Forschungswege für die Entwicklung effizienter, skalierbarer und intelligenter photonischer Systeme.

Papieradresse:
https://go.hyper.ai/5bLoA

Erstellung eines hochpräzisen Simulationsdatensatzes für χ⁽²⁾ nichtlineare Optik

Der in dieser Studie verwendete Datensatz basiert auf einem vollständigen Simulationsmodell des photokathodengetriebenen Lasersystems der kohärenten Quelle am Linearbeschleuniger LCLS-II im SLAC-Labor. Dieses System umfasst eine modengekoppelte Infrarotlaserquelle mit einer Wellenlänge von 1035 nm, einen programmierbaren Spektralformer, einen Chirped-Pulse-Verstärker und ein nichtlineares Frequenzkonversionsmodul (siehe Abbildung a). Um ein breites Spektrum an Pulsmustern abzudecken,Die Studie erzeugte 10.000 Impulsformungskonfigurationen durch zufälliges Abtasten von Dispersionsparametern zweiter Ordnung, Dispersionsparametern dritter Ordnung und Parametern der spektralen Amplitudenformung.Es wurden nicht weniger als 400 Konfigurationen ausschließlich mit Phasenformung erstellt. Jede Konfiguration wurde anschließend einer hochpräzisen Simulation mittels SSFM unterzogen, woraus schließlich drei gekoppelte optische Feldmesspunkte auf 100 Transmissionsschnitten im nichtlinearen Kristall resultierten: SHG1, SFG und SHG2, mit einer Einzelfeld-Abtastpunktzahl von 32.768.

In der Datenvorverarbeitungsphase wurde ein dreistufiges Verfahren angewendet (siehe Abbildung b oben): In der ersten Stufe wird das optische Feld im Frequenzbereich abgeschnitten und abgetastet, wodurch das SFG-optische Feld auf 348 komplexe Werte und die beiden SHG-optischen Felder auf jeweils 1892 komplexe Werte reduziert werden; in der zweiten Stufe werden die Real- und Imaginärteile jedes optischen Feldes zu einem reellwertigen Vektor mit einer festen Länge von 8264 Elementen verkettet; in der dritten Stufe werden alle Elemente des Vektors basierend auf den Extremwerten des gesamten Datensatzes auf das Intervall [0,1] normalisiert.Der endgültige Datensatz wurde in 890.000 Trainingsbeispiele, 10.000 Validierungsbeispiele und 90.000 Testbeispiele unterteilt.

Aufbau einer LSTM-basierten Sequenz-Proxy-Modellarchitektur

Das LSTM-Modell verwendet eine Sequenz-zu-Sequenz-Architektur, wobei jede diskrete Schicht des nichtlinearen Kristalls als Zeitschritt behandelt wird.Dieses Netzwerk enthält 2048 verborgene Einheiten, gefolgt von drei vollständig verbundenen Schichten mit den Dimensionen (2048, 4096), (4096, 4096) bzw. (4096, 8264). Die drei vollständig verbundenen Schichten verwenden die Aktivierungsfunktionen ReLU, Tanh und Sigmoid, wie in der folgenden Abbildung dargestellt.

*Netzwerkarchitektur- und Prozessdiagramm*

Das LSTM-Modell wird mithilfe des Adam-Optimierers und der gewichteten mittleren quadratischen Fehlerverlustfunktion (wMSE) optimiert, wie in der folgenden Abbildung dargestellt:

Während des Trainings verwendet das LSTM-Modell eine Sequenz von 10 räumlichen Schnitten als Eingabe, um den nächsten Schnitt vorherzusagen. Für jeden Satz simulierter Daten mit 100 Schnitten werden 100 Eingabe-Ausgabe-Paare generiert, indem ein Fenster über die Sequenz verschoben wird. Die ersten 9 Paare werden an den Anfang der Eingabesequenz angehängt, um eine einheitliche Eingabelänge zu gewährleisten. Die endgültige Form des Eingabe-Trainingstensors ist (Batchgröße, 10, 8264), und die Form des Ausgabetensors ist ebenfalls (Batchgröße, 8264).

Das LSTM-Modell verwendet einen autoregressiven Ansatz zur Inferenz.Zunächst wird der erste Ausschnitt zehnmal als erste Eingabe wiederholt. Anschließend prognostiziert das LSTM-Modell den nächsten Ausschnitt und fügt ihn an das Ende der Eingabesequenz an, während der älteste Ausschnitt verworfen wird. Die Länge des Eingabefensters bleibt dabei stets bei zehn. Dieser Prozess wird zyklisch wiederholt, um die Ableitung für alle 100 räumlichen Schritte abzuschließen. Mithilfe der Prognoseergebnisse des Sequenzmodells lässt sich der Evolutionsprozess aller physikalischen Feldgrößen im nichtlinearen Kristall vollständig rekonstruieren.

Sowohl Genauigkeit als auch Effizienz werden verbessert, mit einer Beschleunigung um das 252-fache im Vergleich zur Basissimulation.

Um die Inferenzleistung des LSTM-Modells zu bewerten,Die Studie verwendet einen umfassenden Fehlerindex, der sowohl die Wellenformmorphologie als auch die Gesamtenergieempfindlichkeit berücksichtigt.Dieser umfassende Index umfasst drei dimensionslose Komponenten: die Kosinusähnlichkeit der flächennormalisierten Wellenform, die invertiert und skaliert wird, um einen Fehler von Null zu gewährleisten, wenn die Wellenformen perfekt identisch sind; den normalisierten mittleren quadratischen Fehler (NMSE), der auf der Grundlage der gesamten integralen Intensität berechnet wird und proportional zur Energie ist, um Energieabweichungen zu bestrafen; und die Wasserstein-Distanz (Earth Mover's Distance, EMD) zwischen den beiden Sätzen von Intensitätsverteilungskurven, die eine lokale Umverteilung der Intensität genau erkennen kann.

Genauigkeit der Wellenformrekonstruktion

Im Hinblick auf den Versuchsaufbau konvergierte das LSTM nach etwa 180 Trainingsepochen auf einer einzelnen NVIDIA A10G GPU, wobei die Trainingszeit ca. 160 Stunden betrug. Der finale Trainingsverlust und Validierungsverlust erreichten 2,05 × 10⁻⁵ bzw. 2,03 × 10⁻⁵. Die Evaluierungsmethode bestand in der Berechnung des kombinierten Fehlerindex zwischen den Vorhersageergebnissen und den Ergebnissen der SSFM-Simulation.

Um die qualitativen Effekte der experimentellen Ergebnisse visuell darzustellen, wurden Histogramme und Statistiken der kombinierten zeitlichen Intensitätsfehlerindizes für SFG, SHG1 und SHG2 erstellt. Zwei Testdatensätze wurden zufällig aus den vier Quartilen der SFG-Fehlerverteilung ausgewählt. Die vorhergesagten und tatsächlichen Intensitätskurven von SFG und dem zugehörigen SHG1 im Zeit- und Frequenzbereich sind in der folgenden Abbildung dargestellt:

Die beiden folgenden Bildersätze zeigen zwei weitere Beispiele aus dem obersten Quartil der Fehlerverteilung und verdeutlichen die Leistungsfähigkeit des LSTM-Modells unter verschiedenen Formungsbedingungen. Die Ergebnisse zeigen, dass die kombinierten Fehlerindizes für die beiden Modelle 0,012 bzw. 0,003 betragen. Unter beiden Bedingungen gilt:Die LSTM-Modelle können SFG und SHG1 im Frequenz- oder Zeitbereich präzise rekonstruieren. Lokale Abweichungen treten bei SHG1 nur bei großen spektralen Modulationsamplituden auf.Diese Beispiele zeigen, dass das LSTM-Modell unter verschiedenen spektralen Formungsbedingungen eine gute Generalisierung erreichen kann.

*Dies entspricht Betriebsbedingungen, bei denen die reine Phasenformung die primäre Funktion ist und der Grad der spektralen Amplitudenmodulation extrem niedrig ist.*

*Betriebsbedingungen mit deutlichem spektralem Einbruch*

Recheneffizienz des Modells

Die folgende Abbildung zeigt die Inferenzzeit des LSTM-Modells unter verschiedenen Hardwarebedingungen: Die Basissimulation basiert auf dem SSFM-Modell, wobei SSFM die wichtigsten zeitaufwändigen Terme bei der Lösung der nichtlinearen Propagation löst.Konkret dauert die vollständige Simulation auf einer Einkern-CPU 1,98 Sekunden, während die SSFM-Operation etwa 1,875 Sekunden in Anspruch nimmt. Das LSTM-Modell benötigt auf einer Einkern-CPU etwa die gleiche Zeit wie die Basissimulation, was auf den Aufwand der Batchverarbeitung zurückzuführen ist; auf einer einzelnen NVIDIA A100 GPU mit einer Batchgröße von 200 beträgt die Inferenzzeit für ein einzelnes Sample jedoch nur 7,43 Millisekunden, was 252-mal schneller ist als bei der Basissimulation.

Abschluss

Diese Studie basiert auf bisherigen Erfahrungen und integriert mehrere innovative Ansätze, darunter ein kombiniertes Drei-in-Eins-Bewertungssystem, das inverse Kosinusähnlichkeit, NMSE und EMD vereint. Dieses System ersetzt den traditionellen Einzelindex, der für die visuelle und praktische Bewertung verschiedener Pulsmorphologien und Energieskalen ungeeignet ist, und macht die experimentellen Ergebnisse dadurch zuverlässiger und glaubwürdiger.

Der wichtigste Kernvorteil von LSTM liegt in der vollständigen Transformation des traditionellen SSFM-Modells, welches wiederholte Transformationen im Zeit-Frequenz-Bereich erfordert und somit hohe Rechenkosten verursacht. LSTM hingegen lernt die Abbildungsbeziehung direkt im vereinfachten Frequenzbereich, wodurch die häufigen schrittweisen Fourier-Transformationen entfallen und eine Echtzeitberechnung ermöglicht wird. Darüber hinaus lassen sich LSTM-Modelle neben SFG-Prozessen auch auf verschiedene nichtlineare optische Szenarien zweiter Ordnung anwenden und bieten somit ein breites Anwendungspotenzial. Sie eignen sich für die Bedürfnisse aktueller experimenteller und praktischer Anwendungen.

Die erfolgreiche Validierung des LSTM-Modells verdeutlicht schließlich die hohe Effizienz, die maschinelle Lernmodelle im Bereich der nichtlinearen optischen Simulation ermöglichen. Dadurch werden die Grenzen zwischen rein numerischer Simulation und physikalischen Experimenten überwunden und ein neues technisches Paradigma für die Entwicklung effizienter, großflächiger und intelligenter optoelektronischer Systeme geschaffen.

Verwandt Neuigkeiten

Die Hochwasservorhersageleistung Ist Mit Der Des US-amerikanischen Nationalen Wetterdienstes Vergleichbar; Das Wissensbasierte Maschinelle Lernmodell FHNN Verbessert Die Vorhersagegenauigkeit Durch Die Kombination Von Echtzeit-Beobachtungsdaten.

EnergAIzer, Ein Von MIT Und Anderen Entwickeltes Framework Zur GPU-Leistungsschätzung, Führt Vorhersagen Im Durchschnitt in 1,8 Sekunden Mit Einem Fehler Von Ungefähr 81 TP3T durch.

GTC 2026 | Von Vera Rubin Bis NemoClaw: Geht Nvidias Zukunft Über GPUs Hinaus?

Auf Basis Von 25.000 Klinischen Datenpunkten Veröffentlichte Die Stanford University Mit Merlin Das Erste Native 3D-Abdomen-CT-Bildgebungsmodell Mit Visueller Sprache, Das Bei 752 Aufgaben Führend ist.

Zusammenstellung Von Fachartikeln | Über 100 Wichtige Errungenschaften Im Bereich KI Für Die Wissenschaft: Ein Kurzer Überblick Über Technologische Innovationen Bis 2025

Mit DRiffusion Wird Eine 1,4- Bis 3,7-fache Beschleunigung Der Inferenz Erreicht, Um Den Engpass Der Abtastlatenz in Diffusionsmodellen Zu überwinden.

Online-Tutorials | Einfache Bereitstellung Der Neuesten Physikalischen KI-Modelle Von NVIDIA, Einschließlich Humanoider Roboter/Generierung Menschlicher Bewegungen/Feinabstimmung Von Diffusionsmodellen usw.

Die Cornell University Hat EMSeek Entwickelt, Eine Multiagenten-Plattform, Die Elektronenmikroskopbilder in Nur 2-5 Minuten in Materialwissenschaftliche Erkenntnisse Umwandeln kann.

Ein Europäisches Forschungsteam Hat SeaCast Vorgeschlagen, Ein Hochauflösendes Regionales Ozeanvorhersagemodell, Das 15-Tage-Vorhersagen in Nur 20 Sekunden Liefern kann.

HyperAI

Mit Einer Beschleunigung Um Das 252-fache Haben Stanford, UCLA Und Andere Institutionen LSTM Eingesetzt, Um Nichtlineare Optische Simulationen Zweiter Ordnung in Die Millisekunden-Ära Zu bringen.

vor 3 Stunden

Information

KI Für Die Wissenschaft

Künstliche Intelligenz

Maschinelles Lernen

Tiefes Lernen