Command Palette
Search for a command to run...
Stanford, Die Peking-Universität, UCL Und UC Berkeley Arbeiteten Zusammen, Um Mithilfe Von CNN Sieben Seltene Linsenförmige Objekte Aus 810.000 Quasaren Präzise Zu identifizieren.

Einsteins bahnbrechende allgemeine Relativitätstheorie, die er 1915 vorschlug, zeigte, dass Masse nicht nur Gravitation erzeugt, sondern auch die Raumzeit um sich herum krümmt. Dadurch bewegen sich Licht und Materie auf gekrümmten Raumzeitbahnen. Massive Himmelskörper wirken daher wie natürliche Linsen und lenken vorbeiziehende Lichtstrahlen ab.
In der modernen Astronomie ist die starke Gravitationslinse ein entscheidendes Instrument zur Untersuchung der großräumigen Struktur des Universums und der gemeinsamen Entwicklung von Schwarzen Löchern und Galaxien. Quasare, die als starke Gravitationslinsen fungieren, bieten äußerst seltene Beobachtungsmöglichkeiten, um die Entwicklung der Skalierungsbeziehung (insbesondere die Beziehung zwischen der Masse des Schwarzen Lochs und der Masse der Wirtsgalaxie) zwischen supermassereichen Schwarzen Löchern und ihren Wirtsgalaxien in Abhängigkeit von der Rotverschiebung zu untersuchen. Mithilfe dieser leistungsstarken Sonde lässt sich die Masse der Wirtsgalaxie präzise aus dem Einstein-Radius θ<sub>E</sub> ableiten.Allerdings sind Quasare extrem selten, und ihre Identifizierung war für Astronomen schon immer eine große Herausforderung – unter den fast 300.000 im Sloan Digital Sky Survey (SDSS) katalogisierten Quasaren wurden nur 12 Kandidaten gefunden, und nur 3 wurden letztendlich bestätigt.
Vor diesem Hintergrund hat ein Team aus zahlreichen Forschungseinrichtungen, darunter die Stanford University, das SLAC National Accelerator Laboratory, die Peking University, das Brera-Observatorium des italienischen Nationalen Instituts für Astrophysik, das University College London und die University of California, Berkeley, diese ursprünglich winzige Stichprobe durch die Anwendung innovativer Methoden des maschinellen Lernens und Daten des Dark Energy Spectrometer erheblich erweitert.
Das Forschungsteam entwickelte einen datengesteuerten Arbeitsablauf zur Identifizierung von Quasaren, die in den Spektraldaten von DESI DR1 als starke Gravitationslinsenobjekte fungieren.Der Rotverschiebungsbereich liegt zwischen 0,03 und z ≤ 1,8. Die Methode nutzt ein Convolutional Neural Network (CNN), das mit einer realistischen, aus realen DESI-Quasar- und ELG-Spektren simulierten Linse trainiert wurde. Mithilfe dieses Verfahrens identifizierten die Forscher sieben hochwertige (Grad A) Quasar-Lensing-Kandidaten, die alle eine starke [OII]-Doppellinienemission oberhalb der Rotverschiebung des Vordergrundquasars aufweisen; vier dieser Kandidaten zeigen zusätzlich Hβ-, [OIII]λ4959Å- und [OIII]λ5007Å-Emissionslinien.
Hinweis: DESI DR1 ist der erste Datensatz aus spektroskopischen Untersuchungen, der vom Dark Energy Spectral Survey (DESI) veröffentlicht wurde.
Die entsprechenden Forschungsergebnisse mit dem Titel „Quasare, die als starke Linsen fungieren, wurden in DESI DR1 entdeckt“ wurden in gedruckter Form auf arXiv veröffentlicht.
Forschungshighlights:
* Die Stichprobe der in früheren Studien identifizierten Quasarlinsen wurde erweitert (nur 12 Kandidaten, von denen 3 bestätigt wurden).
Dies ebnet den Weg für die Erstellung der ersten statistischen Stichprobe von QSO-starken Gravitationslinseneffekten und demonstriert das Potenzial datengetriebener Methoden für die großflächige Identifizierung solcher seltener Systeme.
Die so gewonnenen Proben bieten einen vielversprechenden neuen Ansatz zur Erforschung der gemeinsamen Entwicklung von Schwarzen Löchern und Galaxien und ermöglichen die Verankerung von Skalenbeziehungen durch direkte Massenmessungen über die kosmische Zeit hinweg.

Papieradresse:
https://arxiv.org/abs/2511.02009
Folgen Sie unserem offiziellen WeChat-Konto und antworten Sie im Hintergrund mit „quasar“, um das vollständige PDF zu erhalten.
Weitere Artikel zu den Grenzen der KI:
https://hyper.ai/papers
Datensatz: 812.118 Quasare, ausgewählt aus DESI DR1
Die erste DESI-Datenveröffentlichung umfasst etwa 1,8 Millionen Quasarspektren, die einen breiten Bereich von Rotverschiebungen abdecken.Für diese Studie wurden 812.118 Quasare anhand des HEALPixel-Rotverschiebungskatalogs der DESI DR1-Hauptdurchmusterung ausgewählt. Um den Einfluss des Mondlichts auf das Spektrum aufgrund des erhöhten blauen Kamerarauschens zu vermeiden (Hellzeitverfahren), wurde das „Dunkelzeitverfahren“ angewendet.
Die Forscher nutzten Daten von Redrock, dessen Ausgabe die TARGETID, die Rotverschiebung (z) und den Rotverschiebungsfehler des Quasars umfasst (Guy et al. 2023). Basierend auf diesen Informationen wurden nur Objekte mit OBJTYPE = TGT und ZCAT PRIMARY = 1 ausgewählt, um Himmelsobjekte und Spektren auszuschließen, die nicht dominant waren oder nicht zur Rotverschiebung passten. Schließlich wurden Objekte mit ZWARN = 0 und SPECTYPE = QSO weiter gefiltert, um Objekte auszuschließen, die zwar als Quasare gekennzeichnet sein könnten, aber eine andere Spektralklassifizierung aufweisen. Diese Filtermethode gewährleistete die Genauigkeit der Rotverschiebung und stellte sicher, dass die Trainingsdaten ausschließlich von Quasarspektren ohne Anomalien in der Rotverschiebungsberechnung stammten.
Nach der Auswahl von QuasarenForscher nutzten den FastSpec-Katalog, um eine Stichprobe von Emissionsliniengalaxien (ELGs) zu erstellen;Dieser Schritt ist entscheidend für die Erstellung der simulierten Linse. Der Katalog basiert auf FastSpecFit1, einer schlanken Verarbeitungspipeline, die Spektralinformationen für DESI-Objekte liefert, darunter Emissionslinienfluss, Rotverschiebung und Klassifizierung. FastSpecFit verwendet Vorlagen, um spezifische Parameter und Spektralmodelle anzupassen und so rauschfreie Spektren zu erzeugen. Die Forscher wählten zunächst ELGs mit derselben Methode und demselben Rotverschiebungsbereich wie für Quasare aus, jedoch mit SPECTYPE = GALAXY. Dieses Screening ergab 16.500 Emissionsliniengalaxien. Um sicherzustellen, dass die ausgewählten Emissionslinien über dem Rauschpegel der Daten lagen, wurden jedoch nur ELGs mit Flüssen > 2 × 10^-17 erg cm^-2 s^-1 aus der Hauptdurchmusterung OII 3726 beibehalten.
Um alle möglichen astrophysikalischen und instrumentellen Störungen im Trainingsdatensatz zu erfassen, wurden während des Trainings reale Beobachtungsdaten verwendet. Da derselbe Datensatz jedoch nicht gleichzeitig für das Training und die eigentliche Linsensuche genutzt werden konnte, wurde er in zwei Phasen aufgeteilt: In Phase 1 wurden 471 von 812.118 Objekten (TP3T) verwendet, die restlichen in Phase 2.
Phase 1:
* Trainingsbeispiele:Das Klassifizierungsnetzwerk und das Rotverschiebungsvorhersagenetzwerk wurden anhand von 70% aus 384.873 Quasaren in den Trainingsdaten der Phase 1 trainiert.
* Validierungsbeispiel:Phase 1: Die verbleibenden 30% in den Trainingsbeispielen werden verwendet, um die Modellleistung während des Trainings zu validieren.
* Blindproben:Die Blindstichprobe besteht aus 427.245 Quasaren, die nicht für Training, Validierung und Test verwendet wurden. Nach Abschluss des Trainings werden in diesem Datensatz nach realen Linsen gesucht.
* Testmuster:Im Rahmen der Tests wurden 3170 Quasare aus der Phase-1-Blindstichprobe verwendet und ein simuliertes Linsensystem für 10% dieser Quasare erstellt. Diese Teststichprobe diente zur Bewertung der Netzwerkleistung nach der Hyperparameteroptimierung.
Phase 2:
In Phase 2 werden die Trainings- und Blindproben vertauscht, und der gleiche Vorgang wird wiederholt.
* Trainingsbeispiele:Das CNN wurde anhand von 70%-Samples aus 427.245 Quasaren in der Phase-1-Blindstichprobe trainiert.
* Validierungsbeispiel:Für die Validierung wurde die Probe 30% aus den 427.245 Proben verwendet.
* Blindproben:Die Blindstichprobe besteht aus 384.873 Quasaren, die nicht für Training, Validierung und Test verwendet wurden.
* Testmuster:In der zweiten Testphase wurden 3.547 Quasare aus den Blindstichproben der zweiten Phase verwendet. Diese Stichproben waren unabhängig von den Trainings- und Validierungsdatensätzen. Unter ihnen wurden 10%-Quasare zur Konstruktion eines simulierten Linsensystems verwendet.
Training eines CNN an einem simulierten Linsensystem und am ungelinsenten Spektrum eines Quasars.
Entwerfen Sie ein Modell, das Quasare, die als starke Gravitationslinsenobjekte wirken, erfolgreich identifizieren kann.Der Schlüssel liegt darin, das Modell mit gekennzeichneten Datensätzen zu trainieren, damit es die Merkmale von Quasarspektren, die als Linsen wirken, von denen von Nicht-Linsen-Quasarspektren unterscheiden kann.Das folgende Diagramm veranschaulicht den gesamten Trainingsprozess:

Forscher nutzten die von DESI beobachteten Spektren von Quasaren (QSOs) und Emissionsliniengalaxien (ELGs), um ein Convolutional Neural Network (CNN) mit simulierten Gravitationslinsensystemen (positive Beispiele) und Spektren von Quasaren ohne Gravitationslinseneffekt (negative Beispiele) zu trainieren. Das Verhältnis von positiven zu negativen Beispielen im Trainingsdatensatz betrug 10% zu 90%.
① Konstruktion des Trainingssets und des simulierten Linsensystems
Obwohl simulierte Spektren zur Generierung von Trainingsdatensätzen für QSO und ELG verwendet werden können,Ziel dieser Studie ist es jedoch, die inhärenten Eigenschaften des DESI-Spektrums zu erhalten.Diese Eigenschaften werden durch Instrumente, Beobachtungsbedingungen oder die Himmelskörper selbst verursacht. Aufgrund verschiedener Faktoren (wie z. B. Spektrallinienverbreiterung, Leuchtkraftunterschiede usw.) weisen die [OII]-Spektrallinien von Quasaren und Elliptischen Galaxien eine hohe Diversität auf. Daher nutzten Forscher direkt Beobachtungsdaten des DR1-Projekts, um neuronale Netze zu trainieren und so die Gesamteigenschaften der Quasare und Elliptischen Galaxien in deren Konstruktion abzubilden.
Allerdings sind Quasare, die als starke Linsen wirken, extrem selten. Im SDSS-Datensatz sind nur 12 von 297.301 Quasaren Kandidaten, und im betrachteten Rotverschiebungsbereich enthält der DESI-DR1-Datensatz nur einen einzigen. Daher sind die positiven Beispiele in dieser Studie, d. h. Quasar-Linsen, …Es ist notwendig, einen Trainingsdatensatz zu erstellen, der eine ausreichende Anzahl positiver und negativer Beispiele enthält, indem das Spektrum des realen Quasars mit dem Spektrum des ELG bei hoher Rotverschiebung überlagert wird.
② Training und Architektur von CNN-Klassifikatoren
Das Klassifikationsnetzwerk besteht aus sechs Faltungsschichten (50 Filter in den ersten drei und 100 Filter in den letzten drei Schichten) und zwei vollständig verbundenen Schichten (30 bzw. 25 Knoten). Die Faltungsschichten extrahieren lokale Merkmale im Spektrum, wie beispielsweise Emissionslinien in Quasar- und ELG-Spektren, und geben einen Wert zwischen 0 und 1 aus. Während des Trainings wird ein Schwellenwert von 0,5 festgelegt, und Proben mit einem Vorhersagewert ≥ 0,5 werden als Linsenkandidaten identifiziert. Bei der Anwendung auf unerkannte Proben wird der Schwellenwert schließlich auf 0,7 optimiert, um den F1-Score zu maximieren.
Die CNN-Architektur besteht aus sechs Faltungsschichten: Die ersten drei Schichten verfügen jeweils über 50 Filter, die letzten drei über jeweils 100 Filter. Die erste vollständig verbundene Schicht besitzt 30 Knoten, die zweite 25 Knoten (siehe linke Seite der obigen Abbildung). Das Netzwerk gibt einen Wert zwischen 0 und 1 aus. Während des Trainings legten die Forscher einen Schwellenwert von 0,5 fest; alle Stichproben mit einem vorhergesagten Wert von mindestens 0,5 wurden vom neuronalen Netzwerk als Linse identifiziert.
Während des Trainings wurde der Adam-Optimierer mit exponentiellem Lernratenabfall verwendet, wobei die Lernrate alle 500 Schritte um den Faktor 0,95 verringert wurde. Das Training wurde mit TensorFlow durchgeführt, und scikit-learn wurde für die Aufteilung des Trainingsdatensatzes, die Berechnung der Konfusionsmatrix und die Metrikberechnung eingesetzt.
Anschließend trainierten die Forscher zwei CNNs mit Trainingsbeispielen aus Phase 1 bzw. Phase 2:Das in Phase 1 trainierte CNN wird für die Blindstichproben der Phase 1 verwendet, und das in Phase 2 trainierte CNN wird für die Blindstichproben der Phase 2 verwendet.Nach dem Training bewertet das Modell seine Klassifizierungsleistung anhand von Testdaten und passt den Schwellenwert basierend auf dem F1-Score an, der die Anzahl der richtig positiven (TP), falsch positiven (FP) und falsch negativen (FN) Ergebnisse kombiniert. Der höchste F1-Score in beiden Phasen entspricht einem Schwellenwert von 0,7.
Schließlich wird jedes Netzwerk auf Blindproben (beobachtete Quasare, die vom Modell nicht erfasst wurden) angewendet, um die erste Liste von Linsenkandidaten zu generieren.
③ Rotverschiebungsvorhersage
Die Rotverschiebung des Vordergrund-Quasars in Quasarspektren lässt sich leicht messen, die Rotverschiebung des Hintergrund-ELG hingegen ist schwer direkt zu bestimmen. Das Forschungsteam nutzte zwei Methoden, um deren Leistungsfähigkeit zu vergleichen:
* Redrock:Das Spektrum wurde mithilfe einer PCA-Vorlage angepasst und eine Gittersuche durchgeführt, um χ² zu minimieren.
* Redshift-CNN-Regressionsmodell:Es verwendet eine CNN-Struktur, die der eines Klassifikators ähnelt, jedoch ist die Ausgabe ein kontinuierlicher Rotverschiebungswert, und es wird mittels mittlerem quadratischen Fehler (MSE) trainiert.
Aufbauend auf den von CNN erstellten Rotverschiebungsvorhersagen verfeinerte das Forschungsteam die Rotverschiebungsvorhersagen weiter, indem es eine lokale doppelte Gauß-Anpassung an der [OII]-Bilinie im Bereich von Δz=0,1 durchführte und gleichzeitig das Signal-Rausch-Verhältnis (SNR) berechnete, um qualitativ hochwertige Kandidaten zu ermitteln.
Ergebnisse im Überblick: Sieben vielversprechende Kandidaten für Gravitationslinsen entdeckt
① Leistung des CNN-Klassifikators: Hervorragende Leistung sowohl auf den Trainings- als auch auf den Validierungsdatensätzen.
Die Leistungskennzahlen des CNN-Klassifikators, angewendet auf die Trainings- und Validierungsdatensätze von Phase 1 und Phase 2, sind in der folgenden Tabelle dargestellt:

Die Ergebnisse zeigen, dass der CNN-Klassifikator sowohl auf den Trainings- als auch auf den Validierungsdatensätzen gut abschneidet, und sowohl der F1-Score als auch die AUC-Metrik deuten darauf hin, dass das Modell Präzision und Trefferquote effektiv ausbalancieren kann.
② Leistungsfähigkeit der Rotverschiebungsmessung: Über alle SNR-Bereiche hinweg ist das CNN-Rotverschiebungsmessgerät dem Redrock-Gerät deutlich überlegen.
In den TestmusternDie Forscher sortierten jedes Objekt nach dem Signal-Rausch-Verhältnis (SNR) der ELG-Signale mit hoher Rotverschiebung, um die Leistungsfähigkeit von CNN und Redrock über verschiedene SNR-Bereiche der [OII]-Emissionsmerkmale hinweg zu beobachten.Sie teilten die Proben anhand von Perzentilen in drei Gruppen ein: niedriges SNR (3 ≤ SNR < 7,52), mittleres SNR (7,52 ≤ SNR < 16,63) und hohes SNR (SNR ≥ 16,63).
Die Ergebnisse zeigen:
* Hohes Signal-Rausch-Verhältnis:Das CNN ermittelte eine Quellenrotverschiebung von 100% innerhalb von Δz = 0,1, die nach der Gauß-Anpassung 99,48% und nach Redrock 51,04% betrug.
* SNR in China:CNN hat einen TP3T-Wert von 99,481, Gaussian Fitting einen TP3T-Wert von 1001 und Redrock einen TP3T-Wert von 37,701.
* Niedriges Signal-Rausch-Verhältnis:Der TP3T-Wert für CNN beträgt 100,001, für Gaussian Fitting 96,881 und für Redrock 29,171.
Zusammenfassend:Über alle SNR-Bereiche hinweg war die CNN-Rotverschiebungsmessung in Kombination mit der Gauß-Anpassung Redrock bei der Wiederherstellung der Hintergrund-ELG-Rotverschiebung deutlich überlegen.Selbst bei deutlichen Skyline-Effekten und Restrauschen in den Infrarotkanälen (auch mit Maskierung) übertreffen CNNs den Standard-Redrock-Ansatz. Die Gauß-Anpassung erreicht im mittleren SNR-Bereich nahezu vollständige Genauigkeit, schneidet aber bei sehr niedrigen SNR-Werten schlecht ab, wo reine CNN-Methoden überlegen sind.
③ Anwendung auf Blindproben: Identifizierung von 7 Linsenkandidaten mit hoher Priorität der Klasse A
Nach Anwendung des trainierten CNN auf 812.118 Quasarspektren wurden insgesamt 494 Kandidaten ausgewählt. Durch manuelle visuelle Inspektion in Kombination mit SNR- und Rotverschiebungsinformationen wurden schließlich 7 hochprioritäre (Klasse A) Linsenkandidaten bestätigt, wie in der folgenden Tabelle dargestellt:

Alle sieben Kandidaten der Klasse A scheinen starke [OII]-Dubletts bei höheren Rotverschiebungen als QSO zu zeigen, wie in der untenstehenden Abbildung dargestellt; vier dieser Kandidaten zeigen außerdem [OIII] λ 4959˚A und Hβ-Linien bei der gleichen Rotverschiebung.

Deep Learning verändert das Paradigma der astronomischen Forschung.
Im letzten Jahrzehnt hat die künstliche Intelligenz (KI), insbesondere Deep Learning, das Forschungsparadigma in der Astronomie rasant verändert. Von der Datenerfassung und Merkmalsextraktion bis hin zum wissenschaftlichen Entdeckungsprozess hat sich die Rolle der KI in der Astronomie von einem „Hilfsmittel“ zu einer zentralen Triebkraft für bahnbrechende Erkenntnisse entwickelt. Der grundlegende Grund dafür ist:Die Astronomie tritt in eine Ära beispielloser Datenexplosion ein.
Großflächige Himmelsdurchmusterungen (wie DESI, LSST und Euclid) erzeugen jährlich Petabytes an Daten, die die Verarbeitungskapazitäten herkömmlicher manueller Analysen und klassischer Algorithmen bei Weitem übersteigen. Deep-Learning-Modelle eignen sich hervorragend zur automatischen Extraktion komplexer Muster aus riesigen Mengen an Beobachtungsdaten und sind daher ideal für die Verarbeitung von Spektral-, Bild- und Zeitreihendaten.
Als einer der typischen VertreterIm November 2025 startete ein Team aus mehr als zehn Forschungseinrichtungen weltweit, darunter die University of California, Berkeley, die University of Cambridge und die University of Oxford, gemeinsam ein Projekt...AION-1: Die erste groß angelegte multimodale Fundamentalmodellfamilie für die Astronomie(Astronomisches omnimodales Netzwerk)Durch die Integration und Modellierung heterogener Beobachtungsdaten wie Bilder, Spektren und Sternkatalogdaten mittels eines einheitlichen, auf frühen Fusionsmodellen basierenden Netzwerks erzielt AION-1 nicht nur hervorragende Ergebnisse in Zero-Shot-Szenarien, sondern erreicht auch eine lineare Detektionsgenauigkeit, die mit speziell für bestimmte Aufgaben trainierten Modellen vergleichbar ist. Indem AION-1 zentrale Herausforderungen wie Datenheterogenität, Rauschen und Instrumentendiversität systematisch angeht, bietet es ein praktikables multimodales Modellierungsparadigma für die Astronomie und andere wissenschaftliche Disziplinen.
Titel des Papiers:AION-1: Omnimodales Fundamentmodell für astronomische Wissenschaften
Papieradresse:https://openreview.net/forum?id=6gJ2ZykQ5W
Im Bereich der Himmelsobjektklassifizierung hat sich Deep Learning zu einer Schlüsseltechnologie entwickelt. Ob es sich um die Klassifizierung der Galaxienmorphologie, die Identifizierung von Supernovae oder die Suche nach starken Gravitationslinsen handelt,Sowohl CNN- als auch Transformer-Architekturen können in hochdimensionalen, unstrukturierten Daten wichtige Merkmale physikalischer Prozesse erkennen und erreichen dabei eine Geschwindigkeit und Konsistenz, die manuelle Methoden bei Weitem übertrifft.
Zum Beispiel,Ein Team unter der Leitung von Dr. Feng Haicheng von der Yunnan Astronomical Observatory der Chinesischen Akademie der Wissenschaften, in Zusammenarbeit mit Dr. Li Rui von der Zhengzhou-Universität und Professor Nicola R. Napolitano von der Universität Neapel Federico II, Italien,Es wurde ein multimodales neuronales Netzwerkmodell entwickelt, das auf innovative Weise Merkmale der Himmelsmorphologie mit SED-Informationen integriert, um eine hochpräzise automatische Identifizierung von Himmelsobjekten wie Sternen, Quasaren und Galaxien zu ermöglichen. Diese Methode wurde in der fünften Datenveröffentlichung des KiDS-Projekts der Europäischen Südsternwarte auf ein 1350 Quadratgrad großes Himmelsareal angewendet und schloss die Klassifizierung von über 27 Millionen Objekten im r-Band mit einer Helligkeit von mehr als 23 mag ab.
Titel des Papiers:Morpho-photometrische Klassifizierung von KiDS DR5-Quellen basierend auf neuronalen Netzen: Ein umfassender Stern-Quasar-Galaxien-Katalog
Papieradresse:https://iopscience.iop.org/article/10.3847/1538-4365/adde5a
Insgesamt ersetzt KI nicht einfach nur traditionelle astronomische Methoden, sondern treibt die Weiterentwicklung wissenschaftlicher Forschungsparadigmen kontinuierlich voran: Sie befreit Astronomen von mühsamer Datenverarbeitung, sodass sie sich auf grundlegende physikalische Fragen konzentrieren können; sie verhindert, dass seltene Himmelskörper von riesigen Datenmengen überflutet werden; und sie ermöglicht ein schnelleres und tieferes Verständnis der Struktur und Entwicklung des Universums.
Quellen:
1.https://arxiv.org/abs/2511.02009
2.https://phys.org/news/2025-11-machine-quasars-lenses.html
3.https://www.cpsjournals.cn/data/article/wl/preview/pdf/10.7693/wl20250701.pdf
4.https://mp.weixin.qq.com/s/6zlnE5-fIw21TQeg1QPPnQ
5.https://www.cas.cn/syky/202507/t20250711_5076040.shtml








