HyperAI

Veröffentlicht in MNRAS, Dem Führenden Astronomiejournal! Das Shanghai Astronomical Observatory Der Chinesischen Akademie Der Wissenschaften Nutzte KI, Um 107 Neutrale Kohlenstoffabsorptionslinien Mit Einer Erkennungsgenauigkeit Von 99,8% Zu Entdecken

特色图像

Die Menschen blicken zum Sternenhimmel hinauf. Tatsächlich sind diese fernen Sternenlichter Milliarden von Jahren durch Zeit und Raum gereist und haben uralte Geschichten erzählt. Die Absorptionslinien des neutralen Kohlenstoffs sind als Schlüsselindikatoren für kalte Gaswolken in frühen Galaxien wie Zeugen der Geschichte des Universums. Ihre Existenz bietet den Menschen die Möglichkeit, einen Blick in die Geheimnisse der Sterne zu werfen.

Während der Sternentwicklung wird bei Sternexplosionen Materie freigesetzt, die reich an chemischen Elementen ist. Diese Elemente durchlaufen im Inneren des Sterns Kernfusionsreaktionen und diffundieren durch die Explosion in den umgebenden Raum. Unter anderem reichert sich im Verlauf der Explosion auch interstellarer Staub mit Elementen wie Kohlenstoff, Sauerstoff und Silizium im interstellaren Medium an, der nicht nur eine wichtige materielle Grundlage für die Entstehung neuer Sterne und Planetensysteme bildet, sondern auch eine Schlüsselrolle bei der Abkühlung und Kondensation des interstellaren Mediums spielt.

Studien haben gezeigt, dass sich in verschiedenen interstellaren Medien die Absorptionslinien von neutralem atomarem Kohlenstoff (CⅠ) bei Wellenlängen von 1560 und 1656 nutzen lassen, um die Menge an kaltem Gas festzustellen und so die Bildung von Molekülwolken, interstellarem Staub und Sternen aufzudecken. Allerdings ist die derzeitige Stichprobengröße der Quasarspektren mit CI-Absorptionslinien zu klein, um als leistungsfähiges Instrument zum Verständnis der allgemeinen Entwicklung der chemischen Häufigkeit im frühen Universum und der Entwicklung von Galaxien zu dienen.

Kürzlich suchte ein internationales Team unter der Leitung von Ge Jian, einem Forscher am Shanghai Astronomical Observatory der Chinesischen Akademie der Wissenschaften, mithilfe von Deep-Learning-Methoden in den vom Sloan Sky Survey III veröffentlichten Daten nach neutralen Kohlenstoffabsorptionslinien (CⅠ-Absorptionslinien) und enthüllte so das Geheimnis der Zusammensetzung kalter Gaswolken in Galaxien im frühen Universum.Es wurden 107 Beispiele für neutrale Kohlenstoffabsorptionslinien im frühen Universum entdeckt.Diese Entdeckung trägt nicht nur zu einem neuen Verständnis der Entwicklung von Galaxien im frühen Universum bei, sondern beweist auch das enorme Potenzial künstlicher Intelligenz in der astronomischen Forschung. Die entsprechenden Forschungsergebnisse wurden in den Monthly Notices of the Royal Astronomical Society (MNRAS) veröffentlicht.

Forschungshighlights:

  • In dieser Studie wurde ein modifizierter Deep-Learning-Algorithmus verwendet, um nach CI-Absorptionslinien zu suchen, wobei Mg II-Absorptionslinien als Markierungen dienten.
  • Die Studie ergab 107 Beispiele für neutrale Kohlenstoffabsorptionslinien im frühen Universum, fast doppelt so viele Proben wie zuvor.
  • Diese Studie kann mehr schwächere Signale als zuvor erkennen und bietet eine neue Forschungsmethode für zukünftige Studien zur frühen Entwicklung des Universums und der Galaxien.


Papieradresse:
https://doi.org/10.1093/mnras/stae799

Datensatz: Generieren Sie 5 Millionen Zufallsstichproben mithilfe der Mg II-Absorptionslinie als Marker

Da CⅠ-Absorptionslinien schwer zu erkennen sind, wurde in dieser Studie der Suchbereich eingegrenzt und nur QSOs (Quasi-Stellar Objects) untersucht, von denen bekannt ist, dass sie MgⅡ-Absorptionslinien aufweisen. Dabei wurden MgⅡ-Absorptionslinien als Wegweiser für die Entdeckung der Absorption durch andere Atomarten verwendet. Darüber hinaus wurden in dieser Studie 1,3Dadurch konnte die Gesamtzahl der Suchziele auf etwa 14.000 reduziert werden.

Verfahren zur Erzeugung von CI-Doppelabsorptionslinien


Da die beiden CⅠ-Absorptionslinien normalerweise sehr schwach und selten sind, liegen sie bei Ruhewellenlängen von 1560 und 1656 Å weit voneinander entfernt, was die Suche nach tiefen neuronalen Netzwerken erschwert. daher,In dieser Studie wurde als Innovation die „Fake-Doublet-Methode“ vorgeschlagen.Ein kleiner Teil des Spektralbereichs um die beiden C I -Absorptionslinien kann extrahiert werden, um eine pseudotypische C I -Doppelabsorptionslinie zu bilden.

Anschließend bietet ein 100 Elemente langes 1D-Flussarray, das aus zwei miteinander verbundenen 12-Å-Fenstern besteht, eine klare Sicht auf lokale Spektralmerkmale und Signal-Rausch-Verhältnisse, während der gesamte Wellenlängenbereich zwischen Absorptionslinien ausgeschlossen wird, wodurch die Probengröße und der Rechenaufwand reduziert werden. Anschließend kann das Deep-Learning-Programm problemlos nach den Doppelabsorptionslinien von Mg II und Ca II suchen.Durch entsprechendes Training des neuronalen Netzwerks ist es möglich, in Quasarspektren nach ungesättigten CI-Dublett-Absorptionslinien zu suchen.

Aufgrund der Unsicherheit bei den Werten der Absorptionsrotverschiebung in den Mg II -Absorptionslinien können die bei der eigentlichen Suche verwendeten Spektren Wellenlängenabweichungen von bis zu etwa ±0,25 Å aufweisen. Zu diesem Zweck wurde in dieser Studie der gleiche Bereich zufälliger Offsets auf die CI-Absorptionslinien in jeder generierten Probe angewendet, wodurch insgesamt 5 Millionen Linien mit einer gleichen Anzahl positiver und negativer Proben generiert wurden. Unter diesen enthalten die positiven Proben zwei CI-Absorptionslinien, und der Varianzparameter wird zufällig aus einer gleichmäßigen Verteilung im Bereich von 0,05–0,8 Å ausgewählt; die negativen Proben enthalten keine CI-Absorptionslinien und der Varianzparameter wird zufällig aus einer gleichmäßigen Verteilung im Bereich von 0,2–1,0 Å ausgewählt.

Vergleich künstlich erzeugter CI-Absorptionslinien mit realen Quasarspektren

Um das Rauschen im Trainingsdatensatz zu simulieren, ziehen wir zufällig Stichproben aus einer Gauß-Verteilung und weisen jedem Spektrum durch Stichproben aus einer Dreiecksverteilung ein Signal-Rausch-Verhältnis (SNR) zu. Dieser Prozess führt zu einem durchschnittlichen Signal-Rausch-Verhältnis von etwa 8,0 für den Trainingssatz, was sehr nahe am durchschnittlichen Signal-Rausch-Verhältnis von 8,4 für die 100.000 QSO-Spektren in SDSS DR12 liegt. gleichzeitig,In dieser Studie wurde das Signal-Rausch-Verhältnis des synthetischen Datensatzes absichtlich in Richtung niedrigerer Werte verzerrt, um die Fähigkeit des Modells zu verbessern, schwache CI-Absorptionslinien zu erkennen.

Modellkonstruktion: Die Modellgenauigkeit liegt bei bis zu 99,8%, was beweist, dass Faltungs-Neuronale Netze sehr effektiv sind

Das Convolutional-Neural-Network-Modell in dieser Studie ist darauf ausgelegt, in jedem Eingangsspektrum zwei CI-Absorptionslinien zu identifizieren. Das Modell besteht aus mehreren Schlüsselkomponenten, darunter eine einzelne Faltungsschicht, eine Batch-Normalisierungsschicht, eine Abflachungsschicht und drei dichte Schichten.

Illustration des Trainings eines tiefen neuronalen Netzwerks

Vor der Eingabe in das Modell wurde in dieser Studie das Rauschen jedes Spektrums normalisiert, wodurch die Auswirkungen des Modellrauschens effektiv eliminiert wurden. Nach der Rauschnormalisierung teilen wir das Ergebnis auch durch 30 und addieren 0,5, um den Flusswert im Bereich von 0 bis 1 zu halten. Dies stellt sicher, dass die Daten der ersten Schicht des Modells (Faltung) normalisiert werden und trägt teilweise zur Normkonsistenz der zweiten Schicht (Batch-Normalisierung) bei.

Die Faltungsschicht wird hauptsächlich zum Erkennen von Spektrallinien und deren Positionen verwendet.Nach umfangreichen Experimenten und Tests stellten wir fest, dass eine einzelne Faltungsschicht mit 8 Filtern und einer Kernelgröße von 3 × 3 ausreichend war.

Nach der FaltungDie Proben werden durch eine Batch-Normalisierungsschicht geleitet, um sicherzustellen, dass die Daten im richtigen Wertebereich für die nachfolgende dichte Schicht liegen. Die Flatten-Schicht wird hauptsächlich verwendet, um die Eingabe zu „glätten“, d. h. um die von der Faltungsschicht ausgegebenen mehrdimensionalen Merkmale in einen eindimensionalen Vektor umzuwandeln.

Die ersten beiden dichten Schichten des Modells verwenden beide eine lineare Aktivierungsfunktion (ReLU) und ihnen ist eine Dropout-Schicht zugewiesen. Gleichzeitig ist die Ausgabeschicht auch eine dichte Schicht mit nur einem Neuron, die die Sigmoid-Aktivierungsfunktion verwendet. Dieses relativ einfache Design bietet eine hervorragende Erkennungsgenauigkeit und ermöglicht gleichzeitig ein extrem schnelles Trainieren und Suchen.

Genauigkeit und Verlust pro Iteration

Danach wurde das Modell insgesamt 20 Mal iteriert. In jeder Iteration werden alle Trainingsbeispiele in Gruppen von 32 durch das Modell geleitet.Insgesamt weist das Modell eine Genauigkeit von 99,81 % auf.Diese hohe Genauigkeit zeigt, dass Convolutional Neural Networks sehr effektiv bei der Erkennung von CI-Absorptionslinien in Spektren sind.

Forschungsergebnisse: 107 CI-Absorptionslinien wurden ausgewählt, und CNN verfügt über unbegrenztes Potenzial bei der Erforschung schwacher Signale

In dieser Studie wurde das trainierte CNN schließlich verwendet, um einen Datensatz von 14.509 Quasarspektren aus dem Mg II-Katalog zu durchsuchen, wobei der Schwerpunkt auf Quasaren mit Rotverschiebungen zwischen 1,3 < Z(abs) < 2,7 lag.

Beispiel für die Ausgabe eines neuronalen Netzwerkmodells

Die Schritte zum Erkennen und Auswählen von Absorptionslinien sind wie folgt:

Erste CNN-Erkennung

Das CNN wurde als binärer Klassifikator eingesetzt und in dieser Studie wurden 14.509 Quasarspektren ausgewertet, wobei jedes Spektrum mit einer Punktzahl zwischen 0 und 1 bewertet wurde. Spektren mit Punktzahlen über dem Schwellenwert von 0,5 wurden als Kandidaten für CI-Absorptionslinien klassifiziert und mit dieser Methode wurden insgesamt 2.056 Kandidaten für die weitere Analyse ausgewählt.

Manuelle Inspektion und Leitungsüberprüfung

Die Studie validierte die CI-Absorptionslinien zusätzlich durch manuelle Inspektion, wobei der Schwerpunkt auf ihren genauen Wellenlängen und der Unterscheidung von benachbarten Absorptionsmerkmalen lag. Wenn eine CI-Linie richtig positioniert war, ihre Paare jedoch erheblich voneinander abwichen, wurden diese ebenfalls ausgeschlossen.Schließlich wurden die Kandidatenproben auf 400 reduziert.

Gaußsche Modellanpassung von CI-Absorptionslinien


Detaillierte Spektrallinienanpassung und Berechnung des Signal-Rausch-Verhältnisses

Zur Anpassung der Kandidaten-CI-Absorptionslinien wurde ein eindimensionales Gauß-Modell verwendet. Dies basiert auf zwei Hauptkriterien: Erstens, obwohl die statische Äquivalentbreite W von λ1656 größer als λ1560 sein sollte, darf W(λ1560) W(λ1656) überschreiten, solange λ1560 innerhalb des 3σ-Vertrauensintervalls bleibt; zweitens beträgt das minimal akzeptable Signal-Rausch-Verhältnis von λ1560 und λ1656 2,5 bzw. 3. Nach diesen StandardsDie Anzahl der Kandidatenproben wurde auf 142 eingegrenzt.

Beispiele für Kandidaten für CI-Absorptionslinien und andere Spektrallinien


Visuelle Inspektion und Spektrallinien-Querverweise

Jedes verbleibende Kandidatenmaterial wurde einer letzten Sichtprüfung unterzogen, wobei insbesondere zusätzliche Spektrallinien untersucht wurden, wenn diese mit den relativen Intensitäten der CI-Linien übereinstimmten. Wir haben Kandidatenproben ausgeschlossen, bei denen die CI-Linie hervorstechend war, aber alle anderen Spektrallinien fehlten.Die endgültige Kandidatenstichprobe wurde auf eine endgültige Liste von 107 getesteten Kohlenstoffabsorbern eingegrenzt.Die folgende Tabelle zeigt einige der CI-Absorptionslinien.

107 CI Absorptionslinienteil

Diese Studie listet im endgültigen Katalog 10 Kohlenstoffabsorber mit detaillierten Informationen auf, darunter Zielname, Koordinaten, Rotverschiebung und statische Äquivalentbreite. Die Ergebnisse zeigen, dass der stärkste Kohlenstoffabsorber W(λ1656) 1,92 Å beträgt, während die statisch äquivalente Breite des schwächsten Kohlenstoffabsorbers 0,1 Å beträgt. Gleichzeitig ermöglicht die CNN-Trainingsmethode, dass die gesamten CI-Absorptionslinien eine geringere äquivalente Breite erreichen und ist in der Lage, CI-Absorptionslinien bei niedrigeren Rotverschiebungen zu erkennen.

Die Studie zeigte auch, dass die CNN-Methode effektiv verwendet werden kann, um zwei schwache Kohlenstoffabsorptionslinien mit breiten Wellenlängen zu finden. Die Methode kann angepasst werden, um nach beliebigen Kombinationen von Absorptions- oder Emissionslinien zu suchen. Dabei muss berücksichtigt werden, dass viele andere Linien in Quasarspektren oder andere Linien mit ähnlichen kontinuierlichen Spektren (wie etwa Sternspektren) weit voneinander entfernt sind und für verschiedene Studien von Bedeutung sind.

KI-Anwendungen in der Astronomie helfen Menschen, die Sterne zu erreichen

Tatsächlich zeigt die neueste Forschung von Professor Ge Jian nur die Spitze des Eisbergs der Anwendung von KI-Technologie in der Astronomie. Mit der Weiterentwicklung der Astronomie werden auch die Herausforderungen immer komplexer. Sie reichen von der Verwaltung riesiger Datenmengen über die präzise Navigation bei der Erforschung des Weltraums bis hin zu detaillierten Untersuchungen ferner Galaxien. All dies erfordert Lösungen, die über traditionelle Methoden hinausgehen.

Durch die Einführung der KI-Technologie können nicht nur riesige, durch astronomische Beobachtungen generierte Datensätze verarbeitet und analysiert werden, sondern sie spielt auch eine Schlüsselrolle bei der Mustererkennung, der prädiktiven Modellierung und automatisierten Beobachtungen und erweitert so die Grenzen unseres Verständnisses des Universums erheblich.

In den letzten Jahren haben Forscher begonnen, das Universum mithilfe von KI immer besser zu verstehen. Im Jahr 2022 arbeiteten Informatiker des Argonne National Laboratory des US-Energieministeriums mit der University of Chicago, der University of Illinois at Urbana-Champaign, NVIDIA und IBM zusammen, um KI und Supercomputer zu kombinieren.Daten im Umfang eines Monats wurden in weniger als 7 Minuten verarbeitet und 4 Gravitationswellensignale identifiziert, die durch die Verschmelzung schwarzer Löcher erzeugt wurden.

Im Jahr 2023Musk offiziell gegründet xA  Unternehmen, dessen Ziel es ist, die wahre Natur des Universums zu verstehen.Musk sagte einmal in einem Interview: „In gewisser Weise ist es unwahrscheinlich, dass eine künstliche Intelligenz, der es darum geht, das Universum zu verstehen, die Menschheit auslöscht, weil wir ein interessanter Teil des Universums sind.“ Im Mai dieses Jahres erhielt xAI im Rahmen einer Finanzierungsrunde der Serie B mehr als 6 Milliarden US-Dollar, wodurch die Bewertung des vor weniger als 10 Monaten gegründeten Unternehmens auf rund 18 Milliarden US-Dollar stieg.

April 2024Die Arbeitsgruppe für künstliche Intelligenz des Nationalen Astronomischen Observatoriums der Chinesischen Akademie der Wissenschaften hat eine neue Generation astronomischer Modelle veröffentlicht: „Star Language 3.0“.Es wurde auf Grundlage des Open-Source-Modells von Tongyi Qianwen gebaut und nun erfolgreich mit dem Mini-Sitian-Teleskop-Array am Xinglong-Observatorium des National Astronomical Observatory verbunden. Dies ist ein klassisches Beispiel für die Anwendung großer Modelle im wissenschaftlichen Bereich und zugleich die erste Anwendung großer Modelle im Bereich der astronomischen Beobachtung.

Im riesigen Universum scheint das Unbekannte immer größer zu sein als das Bekannte, doch die Erforschung der KI hat bereits begonnen, ihre Brillanz zu zeigen. Wir haben Grund zu der Annahme, dass KI mit der Weiterentwicklung der Technologie in Zukunft weitere Geheimnisse des Universums enthüllen, den Menschen helfen wird, das Universum, in dem wir leben, besser zu verstehen und uns zum Meer der Sterne führen wird.