HyperAI

Publié Dans MNRAS, La Revue D'astronomie De Référence ! L'observatoire Astronomique De Shanghai De L'académie Chinoise Des Sciences a Utilisé L'ia Pour Découvrir 107 Lignes D'absorption De Carbone Neutre Avec Une Précision De Détection De 99,8%

特色图像

Les gens regardent le ciel étoilé. Ces étoiles lointaines ont en fait voyagé à travers des milliards d’années de temps et d’espace, racontant des histoires anciennes. Les lignes d'absorption du carbone neutre, en tant que sondes clés des nuages de gaz froids dans les premières galaxies, sont comme des témoins de l'histoire de l'univers. Leur existence offre aux gens une fenêtre permettant de découvrir les mystères des étoiles.

Au cours du processus d’évolution stellaire, la matière libérée par les explosions stellaires contient de riches éléments chimiques. Ces éléments subissent des réactions de fusion nucléaire à l'intérieur de l'étoile et se diffusent dans l'espace environnant avec l'explosion. Parmi eux, la poussière interstellaire, comprenant des éléments tels que le carbone, l'oxygène et le silicium, s'accumule également dans le milieu interstellaire à mesure que l'explosion se propage, ce qui fournit non seulement une base matérielle importante pour la formation de nouvelles étoiles et de nouveaux systèmes planétaires, mais joue également un rôle clé dans le refroidissement et la condensation du milieu interstellaire.

Des études ont montré que dans différents milieux interstellaires, les raies d'absorption du carbone atomique neutre (C Ⅰ) aux longueurs d'onde de 1560 et 1656 peuvent être utilisées pour détecter l'abondance de gaz froid, révélant ainsi la formation de nuages moléculaires, de poussière interstellaire et d'étoiles. Cependant, la taille actuelle de l'échantillon de spectres de quasars contenant des lignes d'absorption CI est trop petite pour être un outil puissant pour comprendre l'évolution globale de l'abondance chimique de l'univers primitif et l'évolution des galaxies.

Récemment, une équipe internationale dirigée par Ge Jian, chercheur à l'Observatoire astronomique de Shanghai de l'Académie chinoise des sciences, a utilisé des méthodes d'apprentissage profond pour rechercher des lignes d'absorption de carbone neutre (lignes d'absorption C Ⅰ) dans les données publiées par le Sloan Sky Survey III, révélant le mystère de la composition des nuages de gaz froid dans les galaxies de l'univers primitif.107 exemples de lignes d’absorption de carbone neutre dans l’univers primitif ont été découverts.Cette découverte non seulement rafraîchit la compréhension de l’évolution des galaxies dans l’univers primitif, mais prouve également l’énorme potentiel de l’intelligence artificielle dans la recherche astronomique. Les résultats de recherche pertinents ont été publiés dans les Monthly Notices of the Royal Astronomical Society (MNRAS).

Points saillants de la recherche :

  • Cette étude a utilisé un algorithme d’apprentissage profond modifié pour rechercher des lignes d’absorption CI en utilisant des lignes d’absorption Mg II comme marqueurs.
  • L’étude a trouvé 107 exemples de lignes d’absorption de carbone neutre dans l’univers primitif, soit près du double du nombre d’échantillons obtenus précédemment.
  • Cette étude permet de détecter davantage de signaux plus faibles qu’auparavant, offrant ainsi une nouvelle méthode de recherche pour les futures études sur l’évolution précoce de l’univers et des galaxies.


Adresse du document :
https://doi.org/10.1093/mnras/stae799

Ensemble de données : En utilisant la ligne d'absorption Mg II comme marqueur, générez 5 millions d'échantillons aléatoires

Les lignes d'absorption C Ⅰ étant difficiles à détecter, cette étude a restreint la portée de la recherche et a uniquement étudié les QSO (objets quasi stellaires) connus pour avoir des lignes d'absorption Mg Ⅱ, en utilisant les lignes d'absorption Mg Ⅱ comme indicateur pour découvrir l'absorption par d'autres espèces atomiques. De plus, cette étude a sélectionné 1,3Cela a permis de réduire le nombre total de cibles de recherche à environ 14 000.

Méthode de génération de raies d'absorption double CI


Étant donné que les deux lignes d'absorption C Ⅰ sont généralement très faibles et rares, elles sont très éloignées l'une de l'autre aux longueurs d'onde de repos de 1560 et 1656 Åare, ce qui rend la recherche de réseaux neuronaux profonds difficile. donc,Cette étude a proposé de manière innovante la « méthode du faux doublet ».Une petite partie de la région spectrale autour des deux lignes d'absorption C I peut être extraite pour former une ligne d'absorption double pseudotype C I.

Ensuite, un réseau de flux 1D de 100 éléments de long composé de deux fenêtres de 12 Å jointes fournit une vue claire des caractéristiques spectrales locales et du rapport signal/bruit tout en excluant toute la plage de longueurs d'onde entre les lignes d'absorption, réduisant ainsi la taille de l'échantillon et les exigences de calcul. Par la suite, le programme d’apprentissage en profondeur peut facilement rechercher les lignes de double absorption Mg II et Ca II.En entraînant de manière appropriée le réseau neuronal, il est possible de rechercher des lignes d'absorption de doublets CI insaturés dans les spectres de quasars.

En raison de l'incertitude des valeurs du décalage vers le rouge d'absorption dans les raies d'absorption du Mg II, les spectres utilisés dans la recherche réelle peuvent présenter des écarts de longueur d'onde allant jusqu'à environ ± 0,25 Å. À cette fin, cette étude a appliqué la même gamme de décalages aléatoires aux lignes d’absorption CI dans chaque échantillon généré, générant un total de 5 millions de lignes contenant un nombre égal d’échantillons positifs et négatifs. Parmi eux, les échantillons positifs contiennent deux lignes d’absorption CI, et le paramètre de variance est échantillonné de manière aléatoire à partir d’une distribution uniforme dans la plage de 0,05 à 0,8 Å ; les échantillons négatifs ne contiennent pas de lignes d'absorption CI et le paramètre de variance est échantillonné de manière aléatoire à partir d'une distribution uniforme dans la plage de 0,2 à 1,0 Å.

Comparaison des raies d'absorption CI générées artificiellement avec les spectres de quasars réels

Pour simuler le bruit dans l'ensemble de données d'entraînement, nous tirons aléatoirement des échantillons d'une distribution gaussienne et attribuons un rapport signal/bruit (SNR) à chaque spectre en échantillonnant à partir d'une distribution triangulaire. Ce processus génère un rapport signal/bruit moyen d’environ 8,0 pour l’ensemble d’entraînement, ce qui est très proche du rapport signal/bruit moyen de 8,4 pour les 100 000 spectres QSO dans SDSS DR12. en même temps,Dans cette étude, le rapport signal/bruit de l'ensemble de données synthétiques a été intentionnellement biaisé vers des valeurs inférieures pour améliorer la capacité du modèle à détecter les lignes d'absorption CI faibles.

Construction du modèle : Le taux de précision du modèle atteint 99,8%, ce qui prouve que les réseaux neuronaux convolutifs sont très efficaces

Le modèle de réseau neuronal convolutif de cette étude est conçu pour identifier deux lignes d’absorption CI dans chaque spectre d’entrée. Le modèle se compose de plusieurs composants clés, notamment une couche convolutive unique, une couche de normalisation par lots, une couche d'aplatissement et trois couches denses.

Illustration de l'entraînement des réseaux neuronaux profonds

Avant d’entrer dans le modèle, cette étude a normalisé le bruit de chaque spectre, éliminant ainsi efficacement l’impact du bruit du modèle. Après la normalisation du bruit, nous divisons également le résultat par 30 et ajoutons 0,5 pour maintenir la valeur du flux dans la plage de 0 à 1. Cela garantit que les données de la première couche du modèle (convolution) sont normalisées et contribue partiellement à la cohérence de la norme de la deuxième couche (normalisation par lots).

La couche convolutive est principalement utilisée pour détecter les lignes spectrales et leurs positions.Après de nombreuses expériences et tests, nous avons constaté qu’une seule couche convolutive avec 8 filtres et une taille de noyau de 3 × 3 était suffisante.

Après la convolution,Les échantillons sont passés par une couche de normalisation par lots pour garantir que les données se trouvent dans la plage de valeurs correcte pour la couche dense suivante. La couche Flatten est principalement utilisée pour « aplatir » l'entrée, c'est-à-dire pour convertir les caractéristiques multidimensionnelles générées par la couche convolutive en un vecteur unidimensionnel.

Les deux premières couches denses du modèle utilisent toutes deux une fonction d'activation linéaire (ReLU) et se voient attribuer une couche de décrochage. Dans le même temps, la couche de sortie est également une couche dense avec un seul neurone, utilisant la fonction d'activation sigmoïde. Cette conception relativement simple offre une excellente précision de détection tout en étant extrêmement rapide à former et à rechercher.

Précision et perte par itération

Après cela, le modèle a été répété 20 fois au total. À chaque itération, tous les échantillons d’entraînement sont transmis au modèle par groupes de 32.Dans l’ensemble, le modèle est précis à 99,81 %.Cette grande précision démontre que les réseaux neuronaux convolutifs sont très efficaces pour détecter les lignes d'absorption CI dans les spectres.

Résultats de la recherche : 107 lignes d'absorption CI ont été sélectionnées et le CNN a un potentiel illimité dans l'exploration des signaux faibles

Dans cette étude, le CNN formé a finalement été utilisé pour rechercher un ensemble de données de 14 509 spectres de quasars du catalogue Mg II, en se concentrant sur les quasars avec des décalages vers le rouge compris entre 1,3 < Z(abs) < 2,7.

Exemple de sortie d'un modèle de réseau neuronal

Les étapes pour détecter et sélectionner les lignes d’absorption sont les suivantes :

Reconnaissance initiale de CNN

Le CNN a été déployé comme classificateur binaire et 14 509 spectres de quasars ont été évalués dans cette étude, chaque spectre étant noté entre 0 et 1. Les spectres avec des scores supérieurs au seuil de 0,5 ont été classés comme candidats à la ligne d'absorption CI, et cette méthode a sélectionné un total de 2 056 candidats pour une analyse plus approfondie.

Inspection manuelle et vérification de ligne

L’étude a en outre validé les lignes d’absorption CI par inspection manuelle, en se concentrant sur leurs longueurs d’onde précises et leur distinction par rapport aux caractéristiques d’absorption adjacentes. Lorsqu'une ligne CI était correctement positionnée, mais que ses paires étaient significativement déviées, celles-ci étaient également exclues.Finalement, les échantillons candidats ont été réduits à 400.

Ajustement du modèle gaussien des lignes d'absorption CI


Ajustement détaillé de la ligne spectrale et calcul du rapport signal/bruit

Un modèle gaussien unidimensionnel a été utilisé pour ajuster les lignes d'absorption CI candidates. Ceci est basé sur deux critères clés : premièrement, bien que la largeur équivalente statique W de λ1656 doive être supérieure à λ1560, W(λ1560) est autorisée à dépasser W(λ1656) tant que λ1560 reste dans l'intervalle de confiance 3σ ; deuxièmement, le rapport signal/bruit minimum acceptable de λ1560 et λ1656 est respectivement de 2,5 et 3. Selon ces normes,Le nombre d’échantillons candidats a été réduit à 142.

Exemples de candidats pour les raies d'absorption CI et autres raies spectrales


Inspection visuelle et recoupement des lignes spectrales

Chaque matériau candidat restant a été soumis à une inspection visuelle finale, en examinant notamment les lignes spectrales supplémentaires lorsque celles-ci correspondaient aux intensités relatives des lignes CI. Nous avons exclu les échantillons candidats où la ligne CI était proéminente mais toutes les autres lignes spectrales étaient absentes.L'échantillon final de candidats a été réduit à une liste finale de 107 absorbeurs de carbone testés.Le tableau ci-dessous montre certaines des lignes d’absorption du CI.

107 CI partie de la ligne d'absorption

Cette étude répertorie 10 absorbeurs de carbone dans le catalogue final, avec des informations détaillées, notamment le nom de la cible, les coordonnées, le décalage vers le rouge et la largeur équivalente statique. Les résultats montrent que l'absorbeur de carbone le plus fort W(λ1656) est de 1,92 Å, tandis que la largeur équivalente statique de l'absorbeur de carbone le plus faible est de 0,1 Å. Dans le même temps, la méthode d’entraînement CNN permet aux lignes d’absorption CI globales d’atteindre une largeur équivalente inférieure et est capable de détecter les lignes d’absorption CI à des décalages vers le rouge inférieurs.

L’étude a également montré que la méthode CNN peut être utilisée efficacement pour trouver deux faibles lignes d’absorption du carbone avec de larges longueurs d’onde. La méthode peut être adaptée pour rechercher n'importe quelle combinaison de lignes d'absorption ou d'émission, en tenant compte du fait que de nombreuses autres lignes dans les spectres de quasars ou d'autres lignes avec des spectres continus similaires (comme les spectres stellaires) sont largement séparées les unes des autres et sont importantes dans diverses études.

Les applications de l'IA en astronomie aident les humains à atteindre les étoiles

En fait, les dernières recherches du professeur Ge Jian ne révèlent que la pointe de l’iceberg de l’application de la technologie de l’IA en astronomie. À mesure que l’astronomie continue de se développer, les défis auxquels elle est confrontée deviennent de plus en plus complexes, de la gestion de quantités massives de données à la navigation précise de l’exploration de l’espace lointain en passant par les études détaillées des galaxies lointaines, qui nécessitent toutes des solutions qui vont au-delà des méthodes traditionnelles.

L’introduction de la technologie de l’IA peut non seulement traiter et analyser d’énormes ensembles de données générés par des observations astronomiques, mais également jouer un rôle clé dans la reconnaissance de formes, la modélisation prédictive et les observations automatisées, élargissant considérablement les limites de notre compréhension de l’univers.

Au cours des dernières années, les chercheurs ont commencé à mieux comprendre l’univers grâce à l’IA. En 2022, des informaticiens du laboratoire national d’Argonne du département américain de l’Énergie ont travaillé avec l’Université de Chicago, l’Université de l’Illinois à Urbana-Champaign, NVIDIA et IBM pour combiner l’IA et les supercalculateurs.Un mois de données a été traité en moins de 7 minutes et 4 signaux d'ondes gravitationnelles générés par la fusion de trous noirs ont été identifiés.

En 2023,Musk officiellement établi xA  entreprise dont le but est de comprendre la véritable nature de l'univers.Musk a déclaré un jour dans une interview : « Dans un sens, une intelligence artificielle qui se soucie de comprendre l'univers a peu de chances d'exterminer l'humanité parce que nous sommes une partie intéressante de l'univers. » En mai de cette année, xAI a reçu plus de 6 milliards de dollars américains de financement de série B, ce qui a également permis à la valorisation de la société, créée il y a moins de 10 mois, d'atteindre environ 18 milliards de dollars américains.

Avril 2024Le groupe de travail sur l'intelligence artificielle de l'Observatoire astronomique national de l'Académie chinoise des sciences a publié une nouvelle génération de modèle astronomique « Star Language 3.0 ».Construit sur la base du modèle open source Tongyi Qianwen, il a maintenant été connecté avec succès au réseau de télescopes Mini Sitian de l'observatoire Xinglong de l'observatoire astronomique national. Il s’agit d’un exemple classique d’application de grands modèles dans le domaine scientifique, et c’est également la première application de grands modèles dans le domaine de l’observation astronomique.

Dans le vaste univers, l’inconnu semble toujours l’emporter sur le connu, mais l’exploration de l’IA a déjà commencé à montrer son génie. Nous avons des raisons de croire qu’à mesure que la technologie continue de mûrir, l’IA révélera davantage de mystères sur l’univers à l’avenir, aidera les humains à comprendre plus profondément l’univers dans lequel nous vivons et nous conduira vers la mer d’étoiles.