نُشرت في مجلة MNRAS، المجلة الفلكية الرائدة! استخدم مرصد شنغهاي الفلكي التابع للأكاديمية الصينية للعلوم الذكاء الاصطناعي لاكتشاف 107 خطوط امتصاص الكربون المحايد بدقة اكتشاف تبلغ 99.8%

ينظر الناس إلى السماء المرصعة بالنجوم. لقد سافرت أضواء النجوم البعيدة هذه في الواقع عبر مليارات السنين من الزمان والمكان، وهي تحكي قصصًا قديمة. وتعتبر خطوط امتصاص الكربون المحايدة، باعتبارها مجسات رئيسية لسحب الغاز الباردة في المجرات المبكرة، بمثابة شهود على تاريخ الكون. إن وجودهم يوفر للناس نافذة للتعرف على أسرار النجوم.
أثناء عملية تطور النجوم، تحتوي المادة المنبعثة من الانفجارات النجمية على عناصر كيميائية غنية. تخضع هذه العناصر لتفاعلات الاندماج النووي داخل النجم وتنتشر في الفضاء المحيط مع الانفجار. ومن بينها، يتراكم الغبار بين النجوم بما في ذلك عناصر مثل الكربون والأكسجين والسيليكون أيضًا في الوسط بين النجوم مع انتشار الانفجار، والذي لا يوفر فقط أساسًا ماديًا مهمًا لتكوين النجوم والأنظمة الكوكبية الجديدة، بل يلعب أيضًا دورًا رئيسيًا في تبريد وتكثيف الوسط بين النجوم.
أظهرت الدراسات أنه في الوسائط بين النجمية المختلفة، يمكن استخدام خطوط امتصاص الكربون الذري المحايد (C Ⅰ) عند أطوال موجية 1560 و 1656 للكشف عن وفرة الغاز البارد، وبالتالي الكشف عن تكوين السحب الجزيئية والغبار بين النجوم والنجوم. ومع ذلك، فإن حجم العينة الحالي من أطياف الكوازار التي تحتوي على خطوط امتصاص CI صغير للغاية ليكون أداة قوية لفهم تطور الوفرة الكيميائية الشاملة في الكون المبكر وتطور المجرات.
في الآونة الأخيرة، استخدم فريق دولي بقيادة جي جيان، الباحث في مرصد شنغهاي الفلكي التابع للأكاديمية الصينية للعلوم، أساليب التعلم العميق للبحث عن خطوط امتصاص الكربون المحايدة (خطوط امتصاص C Ⅰ) في البيانات الصادرة عن مسح سلون سكاي الثالث، كاشفاً عن لغز تكوين سحب الغاز الباردة في المجرات في الكون المبكر.تم اكتشاف 107 أمثلة لخطوط امتصاص الكربون المحايد في الكون المبكر.لا يعمل هذا الاكتشاف على تجديد فهم الناس لتطور المجرات في الكون المبكر فحسب، بل يثبت أيضًا الإمكانات الهائلة للذكاء الاصطناعي في البحث الفلكي. وقد تم نشر نتائج الأبحاث ذات الصلة في الإشعارات الشهرية للجمعية الفلكية الملكية (MNRAS).
أبرز الأبحاث:
- استخدمت هذه الدراسة خوارزمية التعلم العميق المعدلة للبحث عن خطوط امتصاص CI باستخدام خطوط امتصاص Mg II كعلامات.
- توصلت الدراسة إلى 107 أمثلة لخطوط امتصاص الكربون المحايدة في الكون المبكر، وهو ما يقرب من ضعف عدد العينات التي تم الحصول عليها سابقًا.
- تستطيع هذه الدراسة اكتشاف إشارات أضعف من ذي قبل، مما يوفر طريقة بحث جديدة للدراسات المستقبلية للتطور المبكر للكون والمجرات.

عنوان الورقة:
https://doi.org/10.1093/mnras/stae799
مجموعة البيانات: باستخدام خط امتصاص Mg II كعلامة، يتم توليد 5 ملايين عينة عشوائية
نظرًا لصعوبة اكتشاف خطوط امتصاص C Ⅰ، فقد ضيقت هذه الدراسة نطاق البحث ودرست فقط الأجسام شبه النجمية المعروفة بامتلاكها خطوط امتصاص Mg Ⅱ، باستخدام خطوط امتصاص Mg Ⅱ كعلامة لاكتشاف الامتصاص بواسطة الأنواع الذرية الأخرى. بالإضافة إلى ذلك، اختارت هذه الدراسة 1.3وقد ساعد هذا في تقليص العدد الإجمالي لأهداف البحث إلى حوالي 14 ألفًا.

نظرًا لأن خطي امتصاص C Ⅰ ضعيفان جدًا ونادران عادةً، فهما بعيدان عن بعضهما البعض عند أطوال موجية ساكنة تبلغ 1560 و1656 Åare، مما يجعل البحث صعبًا بالنسبة للشبكات العصبية العميقة. لذلك،اقترحت هذه الدراسة بشكل مبتكر "طريقة الزوج المزيف".يمكن استخراج جزء صغير من المنطقة الطيفية حول خطي امتصاص C I لتشكيل خط امتصاص مزدوج C I من النوع الزائف.
بعد ذلك، توفر مجموعة تدفق أحادية الأبعاد بطول 100 عنصر تتكون من نافذتين 12Å متصلتين معًا رؤية واضحة للميزات الطيفية المحلية ونسبة الإشارة إلى الضوضاء مع استبعاد نطاق الطول الموجي بالكامل بين خطوط الامتصاص، وبالتالي تقليل حجم العينة والمتطلبات الحسابية. بعد ذلك، يمكن لبرنامج التعلم العميق البحث بسهولة عن خطوط الامتصاص المزدوجة Mg II و Ca II.من خلال تدريب الشبكة العصبية بشكل مناسب، من الممكن البحث عن خطوط امتصاص مزدوجة غير مشبعة لـ CI في أطياف الكوازار.
وبسبب عدم اليقين في قيم الانزياح الأحمر للامتصاص في خطوط امتصاص Mg II، فإن الأطياف المستخدمة في البحث الفعلي قد تحتوي على انحرافات في الطول الموجي تصل إلى حوالي ±0.25 Å. ولتحقيق هذه الغاية، طبقت هذه الدراسة نفس نطاق الإزاحات العشوائية على خطوط امتصاص CI في كل عينة تم إنشاؤها، مما أدى إلى توليد إجمالي 5 ملايين خط تحتوي على عدد متساوٍ من العينات الإيجابية والسلبية. ومن بينها، تحتوي العينات الإيجابية على خطي امتصاص CI، ويتم أخذ معامل التباين عشوائيًا من توزيع موحد في نطاق 0.05-0.8 Å؛ لا تحتوي العينات السلبية على خطوط امتصاص CI، ويتم أخذ معامل التباين عشوائيًا من توزيع موحد في نطاق 0.2-1.0 Å.

لمحاكاة الضوضاء في مجموعة بيانات التدريب، قمنا بسحب عينات عشوائيًا من توزيع غاوسي وقمنا بتعيين نسبة الإشارة إلى الضوضاء (SNR) لكل طيف من خلال أخذ العينات من توزيع مثلثي. تؤدي هذه العملية إلى نسبة إشارة إلى ضوضاء متوسطة تبلغ حوالي 8.0 لمجموعة التدريب، وهي قريبة جدًا من نسبة الإشارة إلى الضوضاء المتوسطة البالغة 8.4 لطيف 100000 QSO في SDSS DR12. في نفس الوقت،في هذه الدراسة، تم تحيز نسبة الإشارة إلى الضوضاء لمجموعة البيانات الاصطناعية بشكل مقصود نحو قيم أقل لتعزيز قدرة النموذج على اكتشاف خطوط امتصاص CI الضعيفة.
بناء النموذج: معدل دقة النموذج يصل إلى 99.8%، مما يثبت أن الشبكات العصبية التلافيفية فعالة للغاية
تم تصميم نموذج الشبكة العصبية التلافيفية في هذه الدراسة لتحديد خطي امتصاص CI في كل طيف إدخال. يتكون النموذج من عدة مكونات رئيسية، بما في ذلك طبقة ملتوية واحدة، وطبقة تطبيع الدفعة، وطبقة تسطيح، وثلاث طبقات كثيفة.

قبل إدخالها في النموذج، قامت هذه الدراسة بتطبيع ضوضاء كل طيف، مما أدى إلى القضاء بشكل فعال على تأثير ضوضاء النموذج. بعد تطبيع الضوضاء، نقسم النتيجة أيضًا على 30 ونضيف 0.5 للحفاظ على قيمة التدفق في نطاق من 0 إلى 1. يضمن هذا تطبيع بيانات الطبقة الأولى من النموذج (الالتفاف) ويساعد جزئيًا في اتساق معايير الطبقة الثانية (تطبيع الدفعة).
تُستخدم الطبقة التلافيفية بشكل أساسي لاكتشاف الخطوط الطيفية ومواقعها.بعد تجارب واختبارات مكثفة، وجدنا أن طبقة ملتوية واحدة تحتوي على 8 مرشحات وحجم نواة 3×3 كانت كافية.
بعد الالتفاف،يتم تمرير العينات عبر طبقة تطبيع الدفعات للتأكد من أن البيانات تقع في نطاق القيمة الصحيح للطبقة الكثيفة اللاحقة. تُستخدم طبقة التسوية بشكل أساسي "لتسطيح" المدخلات، أي تحويل الميزات متعددة الأبعاد التي تنتجها الطبقة التلافيفية إلى متجه أحادي البعد.
تستخدم الطبقتان الكثيفتان الأوليتان من النموذج دالة تنشيط خطية (ReLU) ويتم تعيين طبقة التسرب لهما. في نفس الوقت، تكون طبقة الإخراج أيضًا طبقة كثيفة تحتوي على خلية عصبية واحدة فقط، باستخدام دالة التنشيط Sigmoid. يوفر هذا التصميم البسيط نسبيًا دقة اكتشاف ممتازة مع كونه سريعًا للغاية في التدريب والبحث.

بعد ذلك، تم تكرار النموذج 20 مرة في المجموع. في كل تكرار، يتم تمرير جميع عينات التدريب عبر النموذج في مجموعات مكونة من 32 عينة.بشكل عام، النموذج دقيق بنسبة 99.81%.تُظهر هذه الدقة العالية أن الشبكات العصبية التلافيفية فعالة جدًا في اكتشاف خطوط امتصاص CI في الأطياف.
نتائج البحث: تم اختيار 107 خطوط امتصاص CI، وتتمتع CNN بإمكانيات غير محدودة في استكشاف الإشارات الضعيفة
في هذه الدراسة، تم استخدام CNN المدربة أخيرًا للبحث في مجموعة بيانات مكونة من 14509 طيفًا من الكوازارات من كتالوج Mg II، مع التركيز على الكوازارات ذات الانزياحات الحمراء بين 1.3 < Z (abs) < 2.7.

الخطوات اللازمة لكشف خطوط الامتصاص وتحديدها هي كما يلي:
التعرف الأولي على شبكة CNN
تم نشر CNN كمصنف ثنائي وتم تقييم 14509 طيفًا من أطياف الكوازار في هذه الدراسة، حيث تم تسجيل كل طيف بين 0 و1. تم تصنيف الأطياف ذات الدرجات الأعلى من عتبة 0.5 كمرشحين لخطوط امتصاص CI، وقد اختارت هذه الطريقة ما مجموعه 2056 مرشحًا لمزيد من التحليل.
التفتيش اليدوي والتحقق من الخط
وقد أثبتت الدراسة صحة خطوط امتصاص CI من خلال الفحص اليدوي، مع التركيز على أطوالها الموجية الدقيقة وتمييزها عن ميزات الامتصاص المجاورة. عندما تم وضع خط CI بشكل مناسب، ولكن أزواجه انحرفت بشكل كبير، تم استبعادها أيضًا.وأخيرا، تم تقليص العينات المرشحة إلى 400.

تركيب خط الطيف التفصيلي وحساب نسبة الإشارة إلى الضوضاء
تم استخدام نموذج غاوسي أحادي البعد لتناسب خطوط امتصاص CI المرشحة. يعتمد هذا على معيارين رئيسيين: أولاً، على الرغم من أن العرض المكافئ الثابت W لـ λ1656 يجب أن يكون أكبر من λ1560، يُسمح لـ W(λ1560) بتجاوز W(λ1656) طالما ظل λ1560 ضمن فاصل الثقة 3σ؛ ثانيًا، الحد الأدنى المقبول لنسبة الإشارة إلى الضوضاء لـ λ1560 وλ1656 هو 2.5 و3 على التوالي. وفقا لهذه المعايير،وتم تقليص عدد العينات المرشحة إلى 142.

التفتيش البصري والمراجعة المتبادلة للخطوط الطيفية
تم إخضاع كل مادة مرشحة متبقية لفحص بصري نهائي، وخاصة فحص الخطوط الطيفية الإضافية عندما تتطابق مع الكثافات النسبية لخطوط CI. لقد استبعدنا العينات المرشحة حيث كان خط CI بارزًا ولكن كانت جميع الخطوط الطيفية الأخرى غائبة.تم تضييق العينة المرشحة النهائية إلى قائمة نهائية تضم 107 من ممتصات الكربون التي تم اختبارها.يوضح الجدول أدناه بعض خطوط امتصاص CI.

تتضمن هذه الدراسة 10 ممتصات كربون في الكتالوج النهائي، مع معلومات مفصلة بما في ذلك اسم الهدف، والإحداثيات، والانزياح الأحمر، والعرض المكافئ الثابت. وتظهر النتائج أن أقوى ممتص للكربون W(λ1656) هو 1.92 Å، في حين أن العرض المكافئ الثابت لأضعف ممتص للكربون هو 0.1 Å. في الوقت نفسه، تعمل طريقة تدريب CNN على تمكين خطوط امتصاص CI الإجمالية من تحقيق عرض مكافئ أقل وتكون قادرة على اكتشاف خطوط امتصاص CI عند انزياحات حمراء أقل.
وأظهرت الدراسة أيضًا أنه يمكن استخدام طريقة CNN بشكل فعال للعثور على خطين ضعيفين لامتصاص الكربون بأطوال موجية واسعة. يمكن تكييف الطريقة للبحث عن أي مجموعة من خطوط الامتصاص أو الانبعاث، مع الأخذ في الاعتبار أن العديد من الخطوط الأخرى في أطياف الكوازار أو الخطوط الأخرى ذات الأطياف المستمرة المماثلة (مثل أطياف النجوم) منفصلة على نطاق واسع عن بعضها البعض وهي مهمة في دراسات مختلفة.
تطبيقات الذكاء الاصطناعي في علم الفلك تساعد البشر على الوصول إلى النجوم
في الواقع، لا يكشف البحث الأخير الذي أجراه البروفيسور جي جيان إلا عن قمة جبل الجليد فيما يتصل بتطبيق تكنولوجيا الذكاء الاصطناعي في علم الفلك. مع استمرار تطور علم الفلك، أصبحت التحديات التي يواجهها معقدة بشكل متزايد، بدءًا من إدارة كميات هائلة من البيانات إلى الملاحة الدقيقة لاستكشاف الفضاء العميق إلى الدراسات التفصيلية للمجرات البعيدة، وكلها تتطلب حلولاً تتجاوز الأساليب التقليدية.
إن إدخال تقنية الذكاء الاصطناعي لا يمكنه معالجة وتحليل مجموعات البيانات الضخمة الناتجة عن الملاحظات الفلكية فحسب، بل يلعب أيضًا دورًا رئيسيًا في التعرف على الأنماط والنمذجة التنبؤية والملاحظات الآلية، مما يوسع بشكل كبير حدود فهمنا للكون.
في السنوات القليلة الماضية، بدأ الباحثون يفهمون الكون بشكل متزايد من خلال الذكاء الاصطناعي. في عام 2022، عمل علماء الكمبيوتر من مختبر أرجون الوطني التابع لوزارة الطاقة الأمريكية مع جامعة شيكاغو، وجامعة إلينوي في أوربانا-شامبين، وشركة NVIDIA، وشركة IBM للجمع بين الذكاء الاصطناعي وأجهزة الكمبيوتر العملاقة.تمت معالجة بيانات شهر كامل في أقل من 7 دقائق، وتم تحديد 4 إشارات موجات الجاذبية الناتجة عن اندماج الثقوب السوداء.
في عام 2023،تم تأسيس ماسك رسميًا إكس أ شركة هدفها فهم الطبيعة الحقيقية للكون.قال ماسك ذات مرة في إحدى المقابلات: "بمعنى ما، من غير المرجح أن يقضي الذكاء الاصطناعي الذي يهتم بفهم الكون على البشرية لأننا جزء مثير للاهتمام من الكون". وفي مايو/أيار من هذا العام، حصلت شركة xAI على أكثر من 6 مليارات دولار أمريكي في تمويل السلسلة B، وهو ما جعل تقييم الشركة، التي تأسست قبل أقل من 10 أشهر، يصل إلى حوالي 18 مليار دولار أمريكي.
أبريل 2024أصدرت مجموعة عمل الذكاء الاصطناعي التابعة للمرصد الفلكي الوطني التابع للأكاديمية الصينية للعلوم الجيل الجديد من النموذج الفلكي "لغة النجوم 3.0".تم بناؤه على أساس نموذج Tongyi Qianwen مفتوح المصدر، وتم الآن توصيله بنجاح بمجموعة تلسكوب Mini Sitian في مرصد Xinglong التابع للمرصد الفلكي الوطني. وهذا مثال كلاسيكي لتطبيق النماذج الكبيرة في المجال العلمي، وهو أيضًا أول تطبيق للنماذج الكبيرة في مجال المراقبة الفلكية.
في الكون الشاسع، يبدو أن المجهول يفوق المعروف دائمًا، لكن استكشاف الذكاء الاصطناعي بدأ بالفعل في إظهار براعته. لدينا سبب للاعتقاد بأنه مع استمرار نضوج التكنولوجيا، فإن الذكاء الاصطناعي سيكشف المزيد من الألغاز حول الكون في المستقبل، ويساعد البشر على فهم الكون الذي نعيش فيه بشكل أعمق، ويقودنا إلى بحر النجوم.