Command Palette
Search for a command to run...
Stanford, l'Université De Pékin, l'UCL Et l'UC Berkeley Ont Collaboré Pour Utiliser Un Réseau De Neurones Convolutifs (CNN) Afin d'identifier Avec Précision Sept Échantillons Lenticulaires Rares Parmi 810 000 quasars.

La théorie révolutionnaire de la relativité générale d'Einstein, proposée en 1915, a révélé que la masse génère non seulement la gravité, mais aussi une courbure de l'espace-temps environnant, contraignant la lumière et la matière à suivre des trajectoires spatio-temporelles courbes. Par conséquent, les corps célestes massifs agissent comme des lentilles naturelles, déviant les rayons lumineux qui les traversent.
En astronomie moderne, la lentille gravitationnelle forte est un outil crucial pour étudier la structure à grande échelle de l'Univers et la coévolution des trous noirs et des galaxies. Les quasars, agissant comme de puissantes lentilles gravitationnelles, offrent des opportunités d'observation extrêmement rares pour étudier l'évolution de la relation d'échelle (en particulier la relation masse du trou noir supermassif – masse de la galaxie hôte) entre les trous noirs supermassifs et leurs galaxies hôtes en fonction du décalage vers le rouge. Grâce à cette sonde puissante, la masse de la galaxie hôte peut être déduite avec précision du rayon d'Einstein θE.Cependant, les quasars sont extrêmement rares et leur identification a toujours constitué un énorme défi pour les astronomes : parmi les près de 300 000 quasars catalogués dans le Sloan Digital Sky Survey (SDSS), seuls 12 candidats ont été trouvés et seulement 3 ont finalement été confirmés.
Dans ce contexte, une équipe composée de nombreuses institutions de recherche, dont l'université de Stanford, le SLAC National Accelerator Laboratory, l'université de Pékin, l'observatoire de Brera de l'Institut national italien d'astrophysique, l'University College London et l'université de Californie à Berkeley, a considérablement élargi cet échantillon initialement minuscule en utilisant des méthodes d'apprentissage automatique innovantes et les données du Dark Energy Spectrometer.
L'équipe de recherche a développé un flux de travail basé sur les données pour identifier les quasars qui agissent comme de puissants objets de lentille gravitationnelle dans les données spectrales de DESI DR1.La plage de décalage vers le rouge couverte est de 0,03 ≤ z ≤ 1,8. Cette méthode utilise un réseau neuronal convolutif (CNN) entraîné sur une lentille simulée réaliste, construite à partir de spectres réels de quasars (QSO) et d'ELG obtenus avec DESI. Grâce à ce processus, les chercheurs ont identifié sept candidats de lentille gravitationnelle de quasar de haute qualité (grade A), présentant tous une forte émission de la double raie [OII] au-dessus du décalage vers le rouge du quasar au premier plan ; quatre de ces candidats présentent également des raies d'émission supplémentaires Hβ, [OIII]λ4959Å et [OIII]λ5007Å.
Remarque : DESI DR1 est le premier lot de données d'étude spectroscopique publiées par le Dark Energy Spectral Survey (DESI).
Les résultats de recherche pertinents, intitulés « Quasars agissant comme des lentilles puissantes découverts dans DESI DR1 », ont été publiés sur arXiv.
Points saillants de la recherche :
* Élargissement de l'échantillon de lentilles de quasar identifiées dans les études précédentes (seulement 12 candidates, dont 3 ont été confirmées).
Cela ouvre la voie à la constitution du premier échantillon statistique de lentilles gravitationnelles fortes de quasars et démontre le potentiel des méthodes basées sur les données pour l'identification à grande échelle de tels systèmes rares.
Les échantillons obtenus offriront une nouvelle voie puissante pour étudier la coévolution des trous noirs et des galaxies, en établissant des relations d'échelle grâce à des mesures directes de masse à travers le temps cosmique.

Adresse du document :
https://arxiv.org/abs/2511.02009
Suivez notre compte WeChat officiel et répondez « quasar » en arrière-plan pour obtenir le PDF complet.
Autres articles sur les frontières de l'IA :
https://hyper.ai/papers
Ensemble de données : 812 118 quasars sélectionnés à partir de DESI DR1
La première publication de données DESI fournit environ 1,8 million de spectres de quasars, couvrant une large gamme de décalages vers le rouge.Cette étude a sélectionné 812 118 quasars sur la base du catalogue de décalage vers le rouge HEALPixel du relevé principal DESI DR1 et a adopté la procédure « temps sombre » pour éviter l'influence du clair de lune sur le spectre en raison de l'augmentation du bruit bleu de la caméra (« procédure temps clair »).
Les chercheurs ont utilisé les informations fournies par Redrock, dont les résultats incluent l'identifiant cible (TARGETID) du quasar, son décalage vers le rouge (z) et l'erreur de décalage vers le rouge (Guy et al. 2023). Sur la base de ces informations, seuls les objets avec OBJTYPE = TGT et ZCAT PRIMARY = 1 ont été sélectionnés afin d'exclure les objets célestes et les spectres non dominants ou ne correspondant pas au décalage vers le rouge. Enfin, les objets avec ZWARN = 0 et SPECTYPE = QSO ont été filtrés pour exclure ceux qui pourraient être identifiés comme des quasars mais présentant des classifications spectrales différentes. Cette méthode de filtrage a permis de garantir la précision du décalage vers le rouge et de s'assurer que les échantillons d'entraînement provenaient uniquement de spectres de quasars sans anomalies dans le calcul du décalage vers le rouge.
Après avoir sélectionné les quasarsLes chercheurs ont utilisé le catalogue FastSpec pour construire un échantillon de galaxies à raies d'émission (ELG) ;Cette étape est cruciale pour la construction de la lentille simulée. Le catalogue repose sur FastSpecFit1, un pipeline de traitement léger qui fournit des informations spectrales pour les objets DESI, notamment le flux des raies d'émission, le décalage vers le rouge et la classification. FastSpecFit utilise des modèles pour ajuster des paramètres spécifiques et des modèles spectraux afin de construire des spectres exempts de bruit. Les chercheurs ont d'abord sélectionné les galaxies à raies d'émission (ELG) en utilisant la même méthode et la même gamme de décalage vers le rouge que pour les quasars, mais avec SPECTYPE = GALAXY. Ce tri a permis d'identifier 16 500 galaxies à raies d'émission, mais seules les ELG présentant des flux supérieurs à 2 × 10⁻¹⁷ erg cm⁻² s⁻¹ issus du relevé principal OII 3726 ont été conservées afin de garantir que les raies d'émission sélectionnées soient au-dessus du niveau de bruit des données.
Des données d'observation réelles ont été utilisées lors de l'entraînement afin de prendre en compte tous les bruits astrophysiques et instrumentaux possibles dans l'ensemble d'entraînement. Cependant, un même lot de données ne pouvait être utilisé simultanément pour l'entraînement et la recherche de lentilles. Par conséquent, l'ensemble de données a été divisé et utilisé en deux phases : la phase 1 a utilisé 471 objets TP3T sur 812 118, le reste étant utilisé lors de la phase 2.
Phase 1 :
* Exemples d'entraînement :Le réseau de classification et le réseau de prédiction du décalage vers le rouge ont été entraînés à l'aide de 70% provenant de 384 873 quasars dans les échantillons d'entraînement de la phase 1.
* Exemple de validation :Phase 1 : Les 30% restants dans les échantillons d'entraînement sont utilisés pour valider les performances du modèle pendant l'entraînement.
* Échantillons à l'aveugle :L'échantillon témoin comprend 427 245 quasars qui n'ont pas été utilisés lors de l'entraînement, de la validation et des tests. Une fois l'entraînement terminé, les lentilles réelles sont recherchées dans cet ensemble de données.
* Échantillon de test :Lors des tests, 3 170 quasars de l’échantillon aveugle de la phase 1 ont été utilisés, et un système de lentille gravitationnelle simulé a été construit pour 10% d’entre eux. Cet échantillon a servi à évaluer les performances du réseau après optimisation des hyperparamètres.
Phase 2 :
Dans la phase 2, les échantillons d'entraînement sont échangés avec les échantillons aveugles, et le même processus est répété.
* Exemples d'entraînement :Le CNN a été entraîné à l'aide de 701 échantillons TP3T provenant de 427 245 quasars dans l'échantillon aveugle de la phase 1.
* Exemple de validation :L'échantillon 30% parmi les 427 245 échantillons utilisés pour la validation a été employé.
* Échantillons à l'aveugle :L'échantillon aveugle est composé de 384 873 quasars qui n'ont pas été utilisés dans l'entraînement, la validation et les tests.
* Échantillon de test :Lors de la phase 2 des tests, 3 547 quasars issus des échantillons anonymes de cette phase ont été utilisés ; ces échantillons étaient indépendants des sous-ensembles d’entraînement et de validation. Parmi eux, 101 quasars TP3T ont servi à construire un système de lentille simulé.
Entraînement d'un CNN sur un système de lentille simulé et sur le spectre non lentillé d'un quasar.
Concevoir un modèle capable d'identifier avec succès les quasars qui agissent comme de puissants objets de lentille gravitationnelle.L'essentiel est d'entraîner le modèle à l'aide d'ensembles de données étiquetés afin qu'il puisse distinguer les caractéristiques des spectres de quasars qui agissent comme des lentilles de celles des spectres de quasars qui n'agissent pas comme des lentilles.Le diagramme suivant illustre le processus de formation complet :

Les chercheurs ont utilisé les spectres de quasars (QSO) et de galaxies à raies d'émission (ELG) observés par DESI pour entraîner un réseau neuronal convolutif (CNN) sur des systèmes de lentilles gravitationnelles simulés (échantillons positifs) et sur des spectres de quasars non lentillés (échantillons négatifs). Le ratio d'échantillons positifs à négatifs dans l'ensemble d'entraînement était de 10% pour 90%.
① Construction du kit d'entraînement et système de lentilles simulées
Bien que les spectres simulés puissent être utilisés pour générer des ensembles d'entraînement pour QSO et ELG,Toutefois, cette étude vise à préserver les caractéristiques inhérentes du spectre DESI.Ces caractéristiques sont dues aux instruments, aux conditions d'observation ou aux corps célestes eux-mêmes. Pour diverses raisons (élargissement des raies spectrales, différences de luminosité, etc.), les raies spectrales [OII] des quasars et des galaxies à très longue portée présentent une grande diversité. C'est pourquoi les chercheurs ont utilisé directement les données d'observation de DR1 pour entraîner des réseaux de neurones, ce qui leur a permis de reproduire les propriétés générales des quasars et des galaxies à très longue portée lors de leur construction.
Cependant, les quasars agissant comme des lentilles gravitationnelles puissantes sont extrêmement rares. Dans l'ensemble de données SDSS, seuls 12 quasars sur 297 301 sont candidats, et dans la gamme de décalage vers le rouge considérée dans cette étude, l'ensemble de données DESI DR1 n'en contient qu'un seul. Par conséquent, les échantillons positifs de cette étude, c'est-à-dire les quasars agissant comme lentilles gravitationnelles, sont…Il est nécessaire de construire un ensemble d'entraînement contenant un nombre suffisant d'échantillons positifs et négatifs en superposant le spectre du QSO réel avec le spectre de l'ELG à décalage vers le rouge élevé.
2. Entraînement et architecture des classificateurs CNN
Le réseau de classification est composé de six couches de convolution (50 filtres pour les trois premières et 100 pour les trois dernières) et de deux couches entièrement connectées (30 et 25 nœuds respectivement). Les couches de convolution servent à extraire des caractéristiques locales du spectre, telles que les raies d'émission des quasars et des spectres ELG, et à attribuer un score compris entre 0 et 1. Lors de l'apprentissage, un seuil de 0,5 est fixé ; les échantillons dont le score de prédiction est supérieur ou égal à 0,5 sont considérés comme des candidats lentilles. Enfin, pour les échantillons non ciblés, le seuil est optimisé à 0,7 afin de maximiser le score F1.
L'architecture du réseau de neurones convolutif (CNN) comprend six couches de convolution : les trois premières comportent chacune 50 filtres, et les trois dernières, 100. La première couche entièrement connectée possède 30 nœuds, et la seconde, 25, comme illustré à gauche du schéma ci-dessus. Le réseau produit un score compris entre 0 et 1. Lors de l'entraînement, les chercheurs ont fixé un seuil de 0,5 ; tout échantillon dont le score prédit était supérieur ou égal à 0,5 était identifié comme une lentille par le réseau de neurones.
Lors de l'entraînement, l'optimiseur Adam a été utilisé avec une décroissance exponentielle du taux d'apprentissage, ce dernier étant réduit d'un facteur 0,95 toutes les 500 itérations. L'entraînement a été réalisé avec TensorFlow, et scikit-learn a été utilisé pour le partitionnement de l'ensemble d'entraînement, le calcul de la matrice de confusion et le calcul des métriques.
Par la suite, les chercheurs ont entraîné deux CNN en utilisant respectivement des échantillons d'entraînement des phases 1 et 2 :Le CNN entraîné lors de la phase 1 est utilisé pour les échantillons aveugles de la phase 1, et le CNN entraîné lors de la phase 2 est utilisé pour les échantillons aveugles de la phase 2.Après l'entraînement, le modèle évalue ses performances de classification sur des échantillons de test et ajuste le seuil en fonction du score F1, qui combine les vrais positifs (VP), les faux positifs (FP) et les faux négatifs (FN). Le score F1 le plus élevé aux deux étapes correspond à un seuil de 0,7.
Enfin, chaque réseau est appliqué à des échantillons aveugles (quasars observés non vus par le modèle) pour générer la première liste de candidats lentilles.
③ Prédiction du décalage vers le rouge
Le décalage vers le rouge du quasar au premier plan dans les spectres de quasars est facile à mesurer, mais celui de la galaxie ELG en arrière-plan est difficile à obtenir directement. L'équipe de recherche a utilisé deux méthodes pour comparer leurs performances :
* Redrock :Le spectre a été ajusté à l'aide d'un modèle PCA et une recherche par grille a été effectuée pour minimiser le χ².
* Modèle de régression CNN Redshift :Il adopte une structure CNN similaire à celle d'un classificateur, mais la sortie est une valeur de décalage vers le rouge continue, et il est entraîné par erreur quadratique moyenne (MSE).
S'appuyant sur les prédictions de décalage vers le rouge effectuées par CNN, l'équipe de recherche a affiné davantage les prédictions de décalage vers le rouge en effectuant un ajustement gaussien double local sur la biline [OII] dans la plage de Δz=0,1, tout en calculant simultanément le rapport signal/bruit (SNR) pour sélectionner les candidats de haute qualité.
Présentation des résultats : Sept candidats prometteurs pour la détection de lentilles ont été découverts.
① Performances du classificateur CNN : Excellentes performances sur les ensembles d'entraînement et de validation.
Les indicateurs de performance du classificateur CNN appliqué aux ensembles d'entraînement et de validation des phases 1 et 2 sont présentés dans le tableau ci-dessous :

Les résultats montrent que le classificateur CNN est performant sur les ensembles d'entraînement et de validation, et que le score F1 et la métrique AUC indiquent que le modèle peut équilibrer efficacement la précision et le rappel.
② Performances de mesure du décalage vers le rouge : Sur toutes les plages de SNR, le dispositif de mesure du décalage vers le rouge CNN surpasse significativement le dispositif Redrock.
Dans les échantillons testés,Les chercheurs ont trié chaque objet en fonction du rapport signal/bruit (SNR) des ELG à décalage vers le rouge élevé afin d'observer les performances de CNN et de Redrock sur différentes plages de SNR des caractéristiques d'émission [OII].Ils ont divisé les échantillons en trois groupes en fonction des percentiles : faible SNR (3 ≤ SNR < 7,52), SNR moyen (7,52 ≤ SNR < 16,63) et SNR élevé (SNR ≥ 16,63).
Les résultats montrent :
* Rapport signal/bruit élevé :Le CNN a récupéré un décalage vers le rouge de la source de 100% dans Δz = 0,1, qui était de 99,48% après ajustement gaussien et de 51,04% après Redrock.
* SNR en Chine :Le CNN a un TP3T de 99,481, l'ajustement gaussien a un TP3T de 1001 et le Redrock a un TP3T de 37,701.
* Faible rapport signal/bruit :Le CNN a un TP3T de 100,001, l'ajustement gaussien a un TP3T de 96,881 et l'ajustement Redrock a un TP3T de 29,171.
En résumé,Sur toutes les plages de rapport signal/bruit, la mesure de décalage vers le rouge du CNN combinée à un ajustement gaussien a largement surpassé Redrock dans la récupération du décalage vers le rouge ELG de fond.Même en présence d'importantes perturbations spectrales et de bruit résiduel dans les canaux infrarouges (même avec masquage), les réseaux de neurones convolutifs (CNN) restent plus performants que l'approche Redrock standard. L'ajustement gaussien atteint une précision quasi parfaite pour des rapports signal/bruit (SNR) moyens, mais ses performances sont médiocres pour des SNR très faibles, où les méthodes CNN pures sont supérieures.
③ Application à des échantillons à l'aveugle : Identification de 7 candidats lentilles de classe A à haute priorité
Après application du réseau de neurones convolutif (CNN) entraîné à 812 118 spectres de quasars, 494 candidats ont été sélectionnés. Grâce à une inspection visuelle manuelle combinée aux informations de rapport signal/bruit et de décalage vers le rouge, 7 candidats lentilles de haute priorité (grade A) ont finalement été confirmés, comme indiqué dans le tableau ci-dessous :

Les sept candidats de classe A semblent tous présenter de forts doublets [OII] à des décalages vers le rouge supérieurs à ceux de QSO, comme le montre la figure ci-dessous ; quatre de ces candidats présentent également des raies [OIII] λ 4959˚A et Hβ au même décalage vers le rouge.

L'apprentissage profond est en train de redéfinir le paradigme de la recherche astronomique.
Au cours de la dernière décennie, l'IA, et plus particulièrement l'apprentissage profond, a profondément transformé le paradigme de la recherche en astronomie. De l'acquisition des données et de l'extraction de caractéristiques au processus de découverte scientifique, le rôle de l'IA en astronomie est passé d'un simple outil à un moteur essentiel des avancées majeures. La raison fondamentale de cette évolution est la suivante :L'astronomie entre dans une ère d'explosion de données sans précédent.
Les relevés astronomiques à grande échelle (tels que DESI, LSST et Euclid) génèrent chaque année des pétaoctets de données, dépassant largement les capacités de traitement des méthodes d'analyse manuelle traditionnelles et des algorithmes classiques. Les modèles d'apprentissage profond excellent dans l'extraction automatique de motifs complexes à partir de volumes massifs de données d'observation, ce qui les rend particulièrement adaptés au traitement des données spectrales, d'images et de séries temporelles.
En tant que l'un des représentants typiquesEn novembre 2025, une équipe composée de chercheurs de plus de dix institutions de recherche du monde entier, dont l'Université de Californie à Berkeley, l'Université de Cambridge et l'Université d'Oxford, a lancé conjointement...AION-1 : La première famille de modèles fondamentaux multimodaux à grande échelle pour l'astronomie(Réseau astronomique omnimodal)En intégrant et en modélisant des informations observationnelles hétérogènes telles que des images, des spectres et des données de catalogues d'étoiles grâce à un réseau dorsal de fusion précoce unifié, AION-1 excelle non seulement dans les scénarios de zéro exemple, mais sa précision de détection linéaire est également comparable à celle de modèles spécifiquement entraînés pour des tâches particulières. En abordant systématiquement des défis majeurs tels que l'hétérogénéité des données, le bruit et la diversité des instruments, AION-1 offre un paradigme de modélisation multimodale viable pour l'astronomie et d'autres domaines scientifiques.
Titre de l'article :AION-1 : Modèle fondamental omnimodal pour les sciences astronomiques
Adresse du document :https://openreview.net/forum?id=6gJ2ZykQ5W
Dans le domaine de la classification des objets célestes, l'apprentissage profond est devenu une technologie phare. Qu'il s'agisse de la classification morphologique des galaxies, de l'identification des supernovae ou de la recherche de lentilles gravitationnelles fortes,Les architectures CNN et Transformer peuvent toutes deux identifier des caractéristiques clés liées aux processus physiques dans des données non structurées de grande dimension, atteignant une vitesse et une cohérence bien supérieures à celles des méthodes manuelles.
Par exemple,Une équipe dirigée par le Dr Feng Haicheng de l'Observatoire astronomique du Yunnan de l'Académie chinoise des sciences, en collaboration avec le Dr Li Rui de l'Université de Zhengzhou et le professeur Nicola R. Napolitano de l'Université de Naples Federico II, en Italie,Un modèle de réseau neuronal multimodal a été proposé, intégrant de manière novatrice les caractéristiques morphologiques célestes aux informations du spectre d'émission (SED) afin d'obtenir une identification automatique de haute précision d'objets célestes tels que les étoiles, les quasars et les galaxies. Cette méthode a été appliquée à une zone du ciel de 1 350 degrés carrés dans la cinquième publication de données du projet KiDS de l'Observatoire européen austral (ESO), permettant ainsi la classification de plus de 27 millions d'objets en bande r de magnitude supérieure à 23.
Titre de l'article :Classification morpho-photométrique des sources KiDS DR5 basée sur des réseaux de neurones : un catalogue complet d’étoiles, de quasars et de galaxies
Adresse du document :https://iopscience.iop.org/article/10.3847/1538-4365/adde5a
Globalement, l'IA ne se contente pas de remplacer les méthodes astronomiques traditionnelles, mais elle contribue constamment à l'évolution des paradigmes de la recherche scientifique : elle libère les astronomes du traitement fastidieux des données afin qu'ils puissent se concentrer sur des questions physiques fondamentales ; elle empêche que les corps célestes rares ne soient submergés par des quantités massives de données ; et elle permet une compréhension plus rapide et plus approfondie de la structure et de l'évolution de l'univers.
Références :
1.https://arxiv.org/abs/2511.02009
2.https://phys.org/news/2025-11-machine-quasars-lenses.html
3.https://www.cpsjournals.cn/data/article/wl/preview/pdf/10.7693/wl20250701.pdf
4.https://mp.weixin.qq.com/s/6zlnE5-fIw21TQeg1QPPnQ
5.https://www.cas.cn/syky/202507/t20250711_5076040.shtml








