HyperAI초신경

최고의 천문학 저널인 MNRAS에 게재되었습니다! 중국과학원 상하이 천문대는 AI를 사용하여 99.8%의 탐지 정확도로 107개의 중성탄소 흡수선을 발견했습니다.

特色图像

사람들은 별이 빛나는 하늘을 올려다본다. 저 멀리 있는 별빛은 실제로 수십억 년의 시간과 공간을 여행하며 고대 이야기를 전하고 있습니다. 초기 은하의 차가운 가스 구름을 탐사하는 핵심 탐사선인 중성 탄소 흡수선은 우주의 역사를 증언하는 증인과 같습니다. 별의 존재는 사람들에게 별의 신비를 들여다볼 수 있는 창을 제공합니다.

별의 진화 과정에서 별의 폭발로 방출된 물질에는 풍부한 화학 원소가 포함되어 있습니다. 이러한 원소는 별 내부에서 핵융합 반응을 겪고 폭발과 함께 주변 우주로 확산됩니다. 그 중에서도 탄소, 산소, 실리콘 등의 원소를 포함한 성간 먼지는 폭발이 확산되면서 성간 물질에 축적되는데, 이는 새로운 별과 행성계 형성을 위한 중요한 물질적 기반을 제공할 뿐만 아니라, 성간 물질의 냉각 및 응축에 핵심적인 역할을 합니다.

연구에 따르면, 서로 다른 성간 물질에서 1560과 1656 파장의 중성 원자 탄소(C Ⅰ)의 흡수선을 사용하면 차가운 가스의 풍부함을 감지할 수 있고, 이를 통해 분자 구름, 성간 먼지 및 별의 형성을 밝힐 수 있습니다. 그러나 CI 흡수선을 포함한 퀘이사 스펙트럼의 현재 표본 크기는 초기 우주의 전반적인 화학적 풍부도 진화와 은하의 진화를 이해하는 강력한 도구가 되기에는 너무 작습니다.

최근 중국과학원 상하이 천문대의 거젠 연구원이 이끄는 국제 연구팀은 딥러닝 방법을 사용하여 슬론 스카이 서베이 III가 공개한 데이터에서 중성 탄소 흡수선(C Ⅰ 흡수선)을 찾아냈으며, 이를 통해 초기 우주의 은하에 존재하는 차가운 가스 구름 구성의 신비를 밝혀냈습니다.초기 우주에서 중성 탄소 흡수선의 예가 107개 발견되었습니다.이번 발견은 초기 우주의 은하 진화에 대한 사람들의 이해를 새롭게 할 뿐만 아니라, 천문학 연구에 있어서 인공지능의 엄청난 잠재력을 입증합니다. 관련 연구 결과는 왕립 천문학회 월간지(MNRAS)에 게재되었습니다.

연구 하이라이트:

  • 본 연구에서는 Mg II 흡수선을 마커로 사용하여 CI 흡수선을 검색하기 위해 수정된 딥러닝 알고리즘을 사용했습니다.
  • 이 연구에서는 초기 우주에서 중성 탄소 흡수선의 예 107개를 발견했는데, 이는 이전에 수집한 샘플 수의 거의 두 배에 달하는 수치입니다.
  • 이번 연구는 이전보다 더 약한 신호를 감지할 수 있었으며, 이는 우주와 은하의 초기 진화에 대한 향후 연구를 위한 새로운 연구 방법을 제공합니다.


서류 주소:
https://doi.org/10.1093/mnras/stae799

데이터 세트: Mg II 흡수선을 마커로 사용하여 500만 개의 무작위 샘플 생성

C Ⅰ 흡수선은 검출하기 어렵기 때문에, 본 연구에서는 탐색 범위를 좁혀 Mg Ⅱ 흡수선이 있는 것으로 알려진 QSO(준별 천체)만을 연구하였으며, Mg Ⅱ 흡수선을 다른 원자종의 흡수를 발견하기 위한 표지판으로 활용하였다. 또한 본 연구에서는 1.3이를 통해 총 검색 대상 수가 약 14,000개로 줄었습니다.

CI 이중 흡수선 생성 방법


두 개의 C Ⅰ 흡수선이 보통 매우 약하고 드물다는 점을 고려하면, 1560과 1656 Å의 정지 파장에서 서로 멀리 떨어져 있어 딥 신경망을 검색하기 어렵습니다. 그러므로,본 연구에서는 혁신적으로 '가짜 더블릿 방법'을 제안했습니다.두 개의 C I 흡수선 주위의 스펙트럼 영역의 작은 부분을 추출하여 유사형 C I 이중 흡수선을 형성할 수 있습니다.

그런 다음 두 개의 12Å 창을 연결하여 100개 요소로 구성된 1D 플럭스 어레이를 통해 흡수선 사이의 전체 파장 범위를 제외하는 동시에 국소적 스펙트럼 특성과 신호 대 잡음비를 명확하게 볼 수 있으므로 샘플 크기와 계산 요구 사항이 줄어듭니다. 이후, 딥러닝 프로그램은 Mg II와 Ca II 이중 흡수선을 쉽게 검색할 수 있습니다.신경망을 적절히 훈련시키면 퀘이사 스펙트럼에서 불포화 CI 더블릿 흡수선을 검색할 수 있습니다.

Mg II 흡수선의 흡수 적색편이 값의 불확실성으로 인해 실제 탐색에 사용된 스펙트럼은 약 ±0.25Å까지의 파장 편차를 가질 수 있습니다. 이를 위해 본 연구에서는 생성된 각 샘플의 CI 흡수선에 동일한 범위의 무작위 오프셋을 적용하여 양성 및 음성 샘플이 동일한 수로 포함된 총 500만 개의 라인을 생성했습니다. 그 중 양성 샘플에는 두 개의 CI 흡수선이 포함되어 있으며 분산 매개변수는 0.05-0.8Å 범위의 균일한 분포에서 무작위로 샘플링됩니다. 음성 샘플에는 CI 흡수선이 포함되지 않으며 분산 매개변수는 0.2-1.0Å 범위의 균일한 분포에서 무작위로 샘플링됩니다.

인공적으로 생성된 CI 흡수선과 실제 퀘이사 스펙트럼의 비교

훈련 데이터 세트의 노이즈를 시뮬레이션하기 위해 가우시안 분포에서 무작위로 샘플을 추출하고 삼각 분포에서 샘플링하여 각 스펙트럼에 신호 대 잡음비(SNR)를 할당합니다. 이 과정을 통해 훈련 세트의 평균 신호 대 잡음비가 약 8.0이 되는데, 이는 SDSS DR12의 100,000개 QSO 스펙트럼의 평균 신호 대 잡음비 8.4와 매우 비슷합니다. 동시에,이 연구에서는 합성 데이터 세트의 신호 대 잡음비를 의도적으로 낮은 값으로 편향시켜 모델의 약한 CI 흡수선을 감지하는 능력을 향상시켰습니다.

모델 구축: 모델 정확도는 최대 99.8%로 높아 합성곱 신경망이 매우 효과적임을 증명합니다.

이 연구의 합성 신경망 모델은 각 입력 스펙트럼에서 두 개의 CI 흡수선을 식별하도록 설계되었습니다. 이 모델은 단일 합성곱 계층, 배치 정규화 계층, 평탄화 계층, 세 개의 밀집 계층을 포함한 여러 가지 주요 구성 요소로 이루어져 있습니다.

딥 신경망 학습의 예시

이 연구에서는 모델에 입력하기 전에 각 스펙트럼의 노이즈를 정규화하여 모델 노이즈의 영향을 효과적으로 제거했습니다. 노이즈 정규화 후, 결과를 30으로 나누고 0.5를 더하여 플럭스 값을 0~1 범위에 유지합니다. 이렇게 하면 모델의 첫 번째 계층(합성곱)의 데이터가 정규화되고 두 번째 계층(배치 정규화)의 규범 일관성을 어느 정도 유지하는 데 도움이 됩니다.

합성곱 계층은 주로 스펙트럼 선과 그 위치를 감지하는 데 사용됩니다.광범위한 실험과 테스트를 거친 후, 8개의 필터와 3×3 커널 크기를 갖춘 단일 합성곱 계층이 충분하다는 것을 발견했습니다.

합성 후,샘플은 배치 정규화 계층을 거쳐 데이터가 후속 밀집 계층의 올바른 값 범위에 있는지 확인합니다. Flatten 계층은 주로 입력을 "평평하게" 만드는 데 사용됩니다. 즉, 합성곱 계층에서 출력된 다차원 특징을 1차원 벡터로 변환하는 데 사용됩니다.

모델의 처음 두 개의 고밀도 레이어는 모두 선형 활성화 함수(ReLU)를 사용하고 드롭아웃 레이어가 지정됩니다. 동시에 출력 계층도 시그모이드 활성화 함수를 사용하는 하나의 뉴런만 있는 밀집 계층입니다. 비교적 간단한 이 디자인은 매우 빠른 학습 및 검색 속도를 제공하는 동시에 뛰어난 감지 정확도를 제공합니다.

반복당 정확도와 손실

그 후, 모델은 총 20번 반복되었습니다. 각 반복에서 모든 교육 샘플은 32개 그룹으로 모델을 통과합니다.전반적으로 모델의 정확도는 99.81%입니다.이러한 높은 정확도는 합성 신경망이 스펙트럼에서 CI 흡수선을 감지하는 데 매우 효과적임을 보여줍니다.

연구 결과: 107개의 CI 흡수선이 선정되었으며, CNN은 약한 신호 탐색에 무한한 잠재력을 가지고 있습니다.

이 연구에서는 훈련된 CNN을 최종적으로 사용하여 Mg II 카탈로그에서 14,509개의 퀘이사 스펙트럼 데이터 세트를 검색했으며, 적색편이가 1.3 < Z(abs) < 2.7인 퀘이사에 초점을 맞췄습니다.

신경망 모델 출력의 예

흡수선을 감지하고 선택하는 단계는 다음과 같습니다.

초기 CNN 인식

이 연구에서는 CNN을 이진 분류기로 활용하고 14,509개의 퀘이사 스펙트럼을 평가했으며, 각 스펙트럼은 0~1 사이의 점수를 받았습니다. 0.5 임계값을 넘는 점수를 받은 스펙트럼은 CI 흡수선 후보로 분류했으며, 이 방법을 통해 추가 분석을 위해 총 2,056개의 후보를 선택했습니다.

수동 검사 및 라인 검증

이 연구에서는 수동 검사를 통해 CI 흡수선을 더욱 검증하고, 정확한 파장과 인접한 흡수 특징과의 구별에 초점을 맞췄습니다. CI 선이 적절하게 배치되었지만 쌍이 크게 벗어난 경우에도 제외되었습니다.마지막으로 후보 샘플은 400개로 줄었습니다.

CI 흡수선의 가우시안 모델 피팅


세부적인 스펙트럼 라인 피팅 및 신호 대 잡음비 계산

후보 CI 흡수선을 맞추기 위해 1차원 가우시안 모델이 사용되었습니다. 이는 두 가지 주요 기준에 근거합니다. 첫째, λ1656의 정적 동등 폭 W는 λ1560보다 커야 하지만 λ1560이 3σ 신뢰 구간 내에 있는 한 W(λ1560)은 W(λ1656)을 초과할 수 있습니다. 둘째, λ1560과 λ1656의 최소 허용 신호 대 잡음비는 각각 2.5와 3입니다. 이러한 표준에 따르면,후보 샘플의 수는 142개로 압축되었습니다.

CI 흡수선 및 기타 스펙트럼선 후보의 예


시각 검사 및 스펙트럼선 교차 참조

남은 후보 물질은 최종 시각 검사를 거쳤으며, 특히 CI 선의 상대적 강도와 일치하는 경우 추가 스펙트럼 선을 조사했습니다. CI 선이 뚜렷하지만 다른 모든 스펙트럼 선이 없는 후보 샘플은 제외했습니다.최종 후보 샘플은 107개의 탄소 흡수제 테스트 목록으로 좁혀졌습니다.아래 표는 일부 CI 흡수선을 보여줍니다.

107 CI 흡수선 부분

이 연구에서는 최종 카탈로그에 탄소 흡수체 10개를 나열했으며, 대상 이름, 좌표, 적색편이 및 정적 등가 폭을 포함한 자세한 정보를 포함했습니다. 결과에 따르면 가장 강한 탄소 흡수체 W(λ1656)는 1.92 Å인 반면, 가장 약한 탄소 흡수체의 정적 등가 폭은 0.1 Å입니다. 동시에 CNN 학습 방법은 전체 CI 흡수선이 더 낮은 등가 폭을 달성할 수 있게 하고 더 낮은 적색편이에서 CI 흡수선을 감지할 수 있습니다.

또한 이 연구에서는 CNN 방법을 사용하면 넓은 파장을 가진 두 개의 약한 탄소 흡수선을 효과적으로 찾을 수 있음을 보여주었습니다. 이 방법은 퀘이사 스펙트럼의 다른 많은 선이나 유사한 연속 스펙트럼을 갖는 다른 선(예: 별 스펙트럼)이 서로 멀리 떨어져 있고 다양한 연구에 중요하다는 점을 고려하여 흡수선이나 방출선의 조합을 검색하는 데 적용할 수 있습니다.

천문학에 AI를 적용하면 인간이 별에 도달하는 데 도움이 됩니다.

사실, 거젠 교수의 최근 연구는 천문학에 AI 기술을 적용하는 것의 빙산의 일각만을 보여줬을 뿐입니다. 천문학이 계속 발전함에 따라, 천문학이 직면하는 과제는 점점 더 복잡해지고 있습니다. 엄청난 양의 데이터 관리부터 깊은 우주 탐사의 정확한 항해, 먼 은하에 대한 자세한 연구까지, 이 모든 것에는 기존 방식을 뛰어넘는 솔루션이 필요합니다.

AI 기술의 도입은 천문 관측으로 생성된 방대한 데이터 세트를 처리하고 분석할 수 있을 뿐만 아니라 패턴 인식, 예측 모델링, 자동화된 관측에서도 핵심적인 역할을 수행하여 우주에 대한 우리의 이해 범위를 크게 확장할 것입니다.

지난 몇 년 동안 연구자들은 AI를 통해 우주를 점점 더 이해하기 시작했습니다. 2022년, 미국 에너지부 산하 Argonne National Laboratory의 컴퓨터 과학자들은 시카고 대학교, 일리노이 대학교 어바나-샴페인 캠퍼스, NVIDIA, IBM과 협력하여 AI와 슈퍼컴퓨터를 결합했습니다.한 달 치의 데이터가 7분 이내에 처리되었고, 블랙홀 합병으로 생성된 중력파 신호 4개가 식별되었습니다.

2023년에머스크가 공식적으로 설립되었습니다 엑스에이  우주의 진정한 본질을 이해하는 것을 목표로 하는 회사입니다.머스크는 한 인터뷰에서 "어떤 의미에서 우주를 이해하는 데 관심이 있는 인공지능이 인간을 멸종시킬 가능성은 낮습니다. 왜냐하면 우리는 우주의 흥미로운 부분이기 때문입니다."라고 말했습니다. 올해 5월, xAI는 시리즈 B 자금 조달에서 60억 달러 이상을 확보했고, 이를 통해 설립된 지 10개월도 안 된 이 회사의 기업 가치는 약 180억 달러에 달했습니다.

2024년 4월중국과학원 국가천문대 인공지능연구팀이 차세대 천문모델 '별언어 3.0'을 공개했습니다.통이첸원 오픈소스 모델을 기반으로 구축된 이 망원경은 현재 국가천문대 싱룽 천문대의 미니 스티안 망원경 어레이에 성공적으로 연결되었습니다. 이는 과학 분야에서 대규모 모델을 적용한 전형적인 사례이며, 천문 관측 분야에서 대규모 모델을 적용한 최초의 사례이기도 합니다.

광활한 우주에서는 알려지지 않은 것이 알려진 것보다 항상 더 큰 것처럼 보이지만, AI의 탐구는 이미 그 탁월함을 보여주기 시작했습니다. 우리는 기술이 계속 발전함에 따라 미래에 AI가 우주에 대한 더 많은 신비를 밝혀내고, 인간이 살고 있는 우주를 더 깊이 이해하도록 돕고, 우리를 별의 바다로 인도할 것이라고 믿을 만한 이유가 있습니다.