HyperAI

جامعة برينستون تطلق وحدة تحكم الذكاء الاصطناعي للتنبؤ بمخاطر تمزق البلازما قبل 300 ميلي ثانية

特色图像


في ظل الضغوط المزدوجة المتمثلة في الطلب المتزايد على الطاقة واقتراب الموعد النهائي لتحقيق هدف "الحياد الكربوني"، فإن تطبيق الطاقة النظيفة ذات الانبعاثات الكربونية المنخفضة أو حتى الصفرية هو الاتجاه العام. في السنوات الأخيرة، حظيت تقنية الاندماج النووي، التي لديها القدرة على توليد الكهرباء مع انبعاثات كربونية صفرية، باهتمام واسع النطاق، وبدأ المزيد والمزيد من العلماء والخبراء في إجراء أبحاث متعمقة.

وعلى الرغم من النجاح الملحوظ الذي حققته تجارب الاندماج النووي في توكاماك، فإن العقبات لا تزال قائمة، حيث يعد تفكك البلازما أحد القضايا الأكثر أهمية التي يجب حلها من أجل تشغيل ناجح للنبضة الطويلة في مفاعل ايتر. السبب الرئيسي هو أن البلازما من السهل جدًا "تمزيقها" والهروب من المجال المغناطيسي القوي المستخدم لحصرها، مما يتسبب في مقاطعة تفاعل الاندماج.

وفي دراسات سابقة، كان من الممكن الحفاظ على طاقة الاندماج لفترة قصيرة من الزمن. في الوقت الحاضر، وبما أن تقنية التعلم التعزيزي العميق (DRL) أظهرت أداءً عاليًا في مشاكل القيادة غير الخطية وعالية الأبعاد، فقد بدأ الناس في استكشاف إدخالها في أبحاث الاندماج النووي.منذ وقت ليس ببعيد، قام الباحثون في جامعة برينستون بتطوير وحدة تحكم الذكاء الاصطناعي للتنبؤ والتحكم التكيفي، والتي يمكنها التنبؤ بالمخاطر المحتملة لتمزق البلازما قبل 300 ميلي ثانية والتدخل في الوقت المناسب. وقد نشرت النتائج ذات الصلة في مجلة "نيتشر".

عنوان الورقة:
https://www.nature.com/articles/s41586-024-07024-9
اتبع الحساب الرسمي ورد "الاندماج النووي" لتحميل الورقة كاملة

الجمع بين أساليب الفيزياء التقليدية والذكاء الاصطناعي

وكما هو موضح في الشكل أدناه، قام الباحثون بدمج الأساليب التقليدية القائمة على الفيزياء مع تقنيات الذكاء الاصطناعي المتقدمة لتحسين التحكم وفهم سلوك البلازما.

الشكل أ:نظام تشخيصي يوضح أدوات التشخيص الرئيسية المستخدمة في هذه الدراسة لمراقبة وتحليل البلازما داخل توكاماك DIII-D.

وتشمل هذه التقنيات المغناطيسية لقياس المجالات المغناطيسية، وتشتت تومسون (TS) لقياس توزيع الكثافة ودرجة الحرارة، وتقنية إعادة تركيب تبادل الشحنة (CER) لقياس درجة حرارة الأيونات ومعدلات التدفق. تم تسليط الضوء على وضع عدم استقرار التمزق المحدد m/n =2/1 باللون البرتقالي في الشكل لتسليط الضوء على أهميته.

الشكل ب:محركات التدفئة وتوجيه التيار والتحكم، والتي توضح أنظمة تسخين البلازما، وتوجيه التيار من خلالها، والتحكم في سلوكها.

ويشمل ذلك على وجه التحديد المعدات اللازمة لحقن حزم الجسيمات، وتطبيق المجالات المغناطيسية، واستخدام موجات الميكروويف أو الترددات الراديوية للتدفئة وتشغيل التيار الكهربائي. تلعب محركات التحكم دورًا رئيسيًا في التحكم بالبلازما لتحقيق الظروف المرغوبة مع مكافحة المواقف غير المستقرة مثل وضع التمزق m/n = 2/1.

الشكل ج:يظهر هنا نظام تحكم لتجنب التمزق، ونظام تحكم لمنع أو تخفيف عدم استقرار التمزق.

في خطوة المعالجة المسبقة، تتم معالجة الإشارات من نظام التشخيص إلى بيانات منظمة بنفس البعد والدقة المكانية من خلال إعادة بناء الملف الشخصي والملاءمة المتوازنة (EFIT)، ثم إدخالها في نموذج الشبكة العصبية العميقة (DNN).

الشكل د:يقوم متحكم الذكاء الاصطناعي القائم على الشبكة العصبية العميقة بتحديد الطاقة الإجمالية للشعاع وشكل البلازما.

تتعامل خوارزمية التجهيز المتوازن (EFIT) مع مهام التحكم منخفضة المستوى، وضبط تيار الملف المغناطيسي وقوة الشعاع لتلبية أوامر التحكم الخاصة بالذكاء الاصطناعي والقيود المحددة مسبقًا من قبل المستخدم، مثل الحفاظ على عامل أمان محدد (q95) وعزم دوران الشعاع.

خوارزميات التعلم المعزز: التحكم المضاد للتمزق

في مفاعل الاندماج، تظهر حالة البلازما في الشكل التالي:

مخطط حالة البلازما

يوضح الخط الأسود في اللوحة (أ) أنه مع زيادة ضغط البلازما عن طريق التسخين الخارجي (مثل شعاع الجسيمات المحايدة)، يتم الوصول في النهاية إلى حد الاستقرار. عندما يتم تجاوز هذا الحد، يتم إثارة عدم الاستقرار الممزق. يوضح الشكلان ب وج أنه بمجرد إثارة عدم استقرار التمزق، سيتم تدمير البلازما بسرعة، مما قد يؤدي إلى عواقب وخيمة في التشغيل الفعلي.

استنادًا إلى الشبكات العصبية العميقة والتعلم المعزز، طور الباحثون نظام تحكم ذكي يمكنه الاستجابة للتغيرات في حالات البلازما في الوقت الفعلي، والتنبؤ بالحالة المستقبلية للبلازما، وضبط إجراءات التحكم وفقًا لذلك، بحيث يتبع تشغيل التوكاماك المسار المثالي ويتجنب عدم استقرار التمزق مع الحفاظ على الضغط العالي.

مسار التحكم في التعلم المعزز

تستخدم نماذج التعلم التعزيزي دالة المكافأة لتطبيق مشكلة تجنب العوائق هذه. يتكامل نموذج الديناميكيات المستخدم للتنبؤ بعدم استقرار التمزق المستقبلي مع مكتبة OpenAI Gym، مما يسمح له بالتفاعل مع وحدة التحكم كبيئة تدريب. يتم تدريب وحدة التحكم في تجنب التمزق باستخدام طريقة تدرج السياسة الحتمية العميقة المطبقة في Keras-RL.

تتمثل ميزة التعلم التعزيزي في القدرة على دخول منطقة βN الأعلى من خلال وحدات تحكم متعددة المحركات (الشعاع والشكل) ومتعددة الأهداف (تمزق منخفض وβN مرتفع) مع الحفاظ على تمزق مقبول.

التحكم في التمزق في DIII-D: التقليدي مقابل الذكاء الاصطناعي

حدود التحكم بالتغذية الراجعة التقليدية

تم إجراء محاولة للحفاظ على ضغط البلازما الطبيعي (βN = 2.3) من خلال طرق التحكم بالتغذية الراجعة التقليدية. ومع ذلك، في التجربة رقم 193273 (الخط الأسود في الشكل أدناه)، عندما وصل الوقت إلى 2.6 ثانية، حدث عدم استقرار كبير في التمزق، مما أدى إلى تدهور لا رجعة فيه لـ βN.وأخيرا، حدث انقطاع البلازما عند 3.1 ثانية.

مزايا التحكم بالذكاء الاصطناعي

في التجربة رقم 193280 (الخط الأزرق في الشكل أدناه)، تم استخدام التحكم بالذكاء الاصطناعي للتحكم بشكل تكيفي في قوة الشعاع وزوايا البلازما الثلاث لضمان عدم تجاوز درجة التمزق المتوقعة عتبة 0.5.


تظهر النتائج التجريبية أن درجة التمزق المقدرة يتم الحفاظ عليها بنجاح أقل من عتبة معينة من خلال التحكم بالذكاء الاصطناعي. وبالمقارنة مع تجربة 193273، يمكن تحقيق درجة تمزيق أقل.

مقارنة بين التحكم التقليدي والتحكم بالذكاء الاصطناعي

استراتيجيات التحكم تحت عتبات التمزيق المختلفة

تجارب على عتبات تمزيق مختلفة

قام الباحثون بمقارنة استراتيجيات التحكم تحت عتبات التمزيق المختلفة. تتوافق أرقام التجربة 193277 (الخط الرمادي في الشكل أعلاه)، و193280 (الخط الأزرق في الشكل أعلاه)، و193281 (الخط الأحمر في الشكل أعلاه) مع تجارب التحكم مع عتبات تمزيق 0.2 و0.5 و0.7 على التوالي.

وفي حالتي k = 0.5 وk = 0.7، يظهر البلازما استقرارًا جيدًا قبل نهاية فترة الهضبة المحددة مسبقًا. يميل المتحكم ذو العتبة الأعلى (k = 0.7) إلى زيادة βN بشكل أكثر عدوانية في المراحل المبكرة من التجربة (t < 3.5 ثانية)، ولكن هذا يتسبب في دخول البلازما إلى منطقة أقل استقرارًا لاحقًا.

كان المتحكم في العتبة المنخفضة مع k = 0.2 متحفظًا للغاية في وقت مبكر من التجربة وقمع بشكل مفرط إمكانية عدم الاستقرار. حتى t = 5 ثوانٍ، حافظت AI على درجة تمزق منخفضة للغاية (أقل من 0.2)، ولكنها أظهرت فجأة عدم استقرار لا مفر منه عند t = 5.5 ثانية.

في المقابل، يكون المتحكم ذو عتبة متوسطة (k = 0.5) قادرًا على الحفاظ على استقرار البلازما حتى نهاية فترة الهضبة واستعادة βN مرة أخرى في النهاية.ويشير هذا إلى أن هناك حاجة إلى عتبة مثالية للحفاظ على بلازما مستقرة لفترة طويلة.

لا يزال السعي وراء الكأس المقدسة للطاقة النظيفة يواجه العديد من التحديات

يعد تحقيق الاندماج النووي المتحكم فيه أحد الأهداف الأكثر تحديًا في العلوم والهندسة الحديثة ويعتبر الكأس المقدسة للطاقة النظيفة. متى سيتمكن البشر من حمل هذه الكأس المقدسة، وما الدور الذي ستلعبه الذكاء الاصطناعي في ذلك؟

أثبت هذا البحث بنجاح إمكانات الذكاء الاصطناعي في التحكم الفعال في تفاعلات الاندماج. بالإضافة إلى ذلك، استخدم جايمين، المؤلف الأول لهذه الورقة، أيضًا أساليب التعلم التعزيزي بشكل مبتكر أثناء متابعته لدراسته للدكتوراه في قسم الهندسة النووية في جامعة سيول الوطنية لتصميم خوارزمية جديدة للتحكم في البلازما لـ KSTAR (منشأة كوريا للأبحاث المتقدمة في مجال الموصلات الفائقة توكاماك).

بانوراما لمفاعل الاندماج النووي توماهوك التابع لـ KSTAR

على الرغم من أن المزيد والمزيد من الباحثين بدأوا في إجراء أبحاث متعمقة حول الاندماج النووي ويقتربون من هذا الهدف المقدس خطوة بخطوة، إلا أنه لا تزال هناك العديد من الحواجز التقنية التي تحتاج إلى حل:

1. استقرار البلازما:

يعد التحكم في استقرار البلازما ذات درجة الحرارة العالية أحد التحديات الرئيسية في تحقيق الاندماج النووي المتحكم فيه. يجب الحفاظ على البلازما عند درجة حرارة وضغط مرتفعين بما يكفي لدعم معدل تفاعل الاندماج الضروري، الأمر الذي يتطلب تقنية التحكم في المجال المغناطيسي الدقيقة للغاية.


2. القضايا المادية:

في الوقت الحالي، لا توجد مادة يمكنها تحمل درجات الحرارة العالية والتعرض لتدفق الأيونات العالية على المدى الطويل دون تدهور كبير. يمكن أن يؤدي التعرض للإشعاع النيوتروني إلى هشاشة المواد وتدهور أدائها، وهي مشكلة كبيرة تؤثر على التشغيل والاقتصاد في المفاعل على المدى الطويل.


3. التقاط الطاقة وتحويلها:

وتشكل كيفية التقاط الطاقة بكفاءة من تفاعلات الاندماج وتحويلها إلى طاقة كهربائية أيضًا محورًا للبحث الحالي. تشكل أنظمة تحويل الحرارة إلى كهرباء عالية الكفاءة أهمية بالغة لتحقيق طاقة الاندماج القابلة للتطبيق اقتصاديًا.

4. توليد وتوريد الوقود الاندماجي:

يمكن أن يخضع التريتيوم والديوتيريوم لتفاعلات الاندماج النووي ويتم استخدامهما كوقود اندماج نووي متحكم فيه. على الرغم من أن الديوتيريوم متوفر بكثرة في الطبيعة، إلا أن التريتيوم نادر للغاية. من الصعب للغاية تحضيره صناعيا ويجب إنتاجه داخل المفاعل من خلال التقاط النيوترونات أو الحصول عليه بطرق أخرى. تبلغ قيمة كيلوغرام واحد من التريتيوم أكثر من 100 مليون دولار.

في السنوات الأخيرة، جلب الذكاء الاصطناعي الكثير من المفاجآت إلى البحث العلمي، بدءًا من قدرة AlphaFold على التنبؤ ببنية البروتين، إلى تقديم صور للثقوب السوداء استنادًا إلى التعلم الآلي، إلى التنبؤ بتغيرات الطقس استنادًا إلى الشبكات العصبية...

اليوم، تم التغلب على المشكلة الصعبة المتمثلة في استقرار البلازما بواسطة الذكاء الاصطناعي، الذي تراكمت لديه الخبرة لتطبيق الذكاء الاصطناعي في عملية البحث في الاندماج النووي المتحكم فيه. وأعتقد أن المزيد من التحديات المذكورة أعلاه سيتم التغلب عليها أيضًا من خلال الاستكشاف المستمر من قبل الباحثين!