Command Palette
Search for a command to run...
بفضل تسريع يصل إلى 252 مرة، استخدمت جامعة ستانفورد وجامعة كاليفورنيا في لوس أنجلوس ومؤسسات أخرى تقنية LSTM لنقل عمليات المحاكاة البصرية غير الخطية من الدرجة الثانية إلى عصر الميلي ثانية.

يُعدّ علم البصريات غير الخطية من الرتبة الثانية أهم فروع علم البصريات غير الخطية وأكثرها استخدامًا. وهو يدرس بشكل أساسي التأثيرات البصرية التي يهيمن عليها الاستقطاب غير الخطي من الرتبة الثانية χ⁽²⁾ عندما تتفاعل أشعة الليزر القوية مع بلورات بصرية خاصة تفتقر إلى تناظر الانعكاس المركزي. بعبارة أخرى،عندما يدخل شعاع ليزر عالي الكثافة هذا النوع من البلورات، تخضع الفوتونات لعملية "دمج الطاقة وإعادة تركيب التردد"، مما يؤدي مباشرة إلى توليد شعاع ضوئي بتردد ولون جديدين تمامًا.يُمكّن هذا من إجراء تحويلات غير خطية كلاسيكية مثل توليد التوافقي الثاني (SHG) وتوليد تردد الجمع (SFG) وتوليد تردد الفرق (DFG). في أبحاث البصريات الحديثة،تُعد البصريات غير الخطية من الدرجة الثانية أساسًا فيزيائيًا رئيسيًا لمجالات مثل المعلومات الكمومية، والرقائق الضوئية المتكاملة، والتصوير الطبي الحيوي، وأنظمة الليزر عالية الطاقة.
حالياً، يعتبر البحث النظري حول العمليات البصرية غير الخطية من الدرجة الثانية ناضجاً تماماً، ولكن لا تزال هناك عقبات كبيرة في الهندسة العملية والتنفيذ التجريبي.من ناحية أخرى، تكاليف قوة الحوسبة مرتفعة.يجب أن تحسب خوارزميات المحاكاة التقليدية القائمة على تحويل فورييه بدقة التغيرات التذبذبية في الحقول البصرية فائقة السرعة، كما تحتاج إلى استخدام طريقة فورييه ذات الخطوات المنفصلة (SSFM) لمحاكاة عملية انتقال الضوء المجزأة في الوسط. وهذا ما يجعل المحاكاة العددية تتطلب موارد حاسوبية هائلة. في سيناريوهات الوقت الحقيقي، مثل تجارب الليزر ذات معدل التكرار العالي، ستبرز هذه المشكلة بشكل أكبر مع ازدياد الطلب على التحكم التكيفي وتحسين المعلمات في الوقت الحقيقي.
من ناحية أخرى، فإن النموذج منفصل عن الواقع.تتسم النماذج الفيزيائية التقليدية بالمثالية، وتواجه صعوبة في استيعاب عوامل عدم الاستقرار في العالم الحقيقي، مثل الأخطاء التجريبية والضوضاء البيئية وانحراف أنظمة المعدات. وتفتقر هذه النماذج إلى المرونة اللازمة للتكيف مع ظروف العالم الحقيقي، مما يؤدي إلى فجوة بين النتائج التجريبية والتطبيقات العملية. علاوة على ذلك، فإن التطور المتزايد للتوائم الرقمية البصرية والمحاكاة المشتركة متعددة المستويات للسلاسل غير الخطية، جعل من الضروري في الصناعة ابتكار أدوات جديدة تجمع بين المحاكاة الآنية وقدرات الربط التجريبي.
استجابةً لذلك، قامت فرق من جامعة ستانفورد، وجامعة كاليفورنيا في لوس أنجلوس، ومختبر SLAC الوطني للمسرعات، مستلهمةً من الأبحاث السابقة حول تطبيق الشبكات العصبية المتكررة (RNNs) على انتشار نبضات الألياف الضوئية،نقترح نموذجًا بديلًا يعتمد على شبكات الذاكرة طويلة المدى (LSTM)، والذي يمكنه التنبؤ بمجال الضوء الناتج عن SFG بسرعة ودقة، مع تقليل التكاليف الحسابية بشكل كبير.تم تدريب النموذج باستخدام مجموعة بيانات محاكاة SSFM التي تم إنشاؤها من نموذج الليزر الذي يعمل بالكاثود الضوئي LCLS-II (مصدر الضوء المتماسك الخطي II) في مختبر SLAC.بالمقارنة مع النماذج التقليدية، زادت سرعة الحساب بمقدار 252 مرة.وقد أدى ذلك إلى وضع أساس تقني هام لتحسين أنظمة الليزر في الوقت الفعلي، ونمذجة دمج البيانات، والتوائم الرقمية.
تم نشر النتائج ذات الصلة، بعنوان "النمذجة بمساعدة التعلم العميق للبصريات غير الخطية χ⁽²⁾"، في مجلة Advanced Photonics.
أبرز الأبحاث:
* إن توسيع نماذج التعلم العميق لتشمل أنظمة ديناميكيات الاستقطاب البصري غير الخطي من الدرجة الثانية متعددة المجالات المقترنة بشكل كامل يحسن بشكل شامل سرعة الحساب والمرونة وقابلية تطبيق النمذجة البصرية غير الخطية.
* عند تشغيلها على وحدة معالجة الرسومات NVIDIA A100 واحدة بحجم دفعة يبلغ 200، انخفض وقت الاستدلال لعينة واحدة إلى 7.43 مللي ثانية، وهو تحسن بمقدار 252 مرة مقارنة بنموذج SSFM.
يسد هذا البحث الفجوة بين المحاكاة العددية والتطبيقات التجريبية العملية، مما يفتح آفاقًا بحثية جديدة لتصميم أنظمة ضوئية فعالة وقابلة للتطوير وذكية.

عنوان الورقة:
https://go.hyper.ai/5bLoA
إنشاء مجموعة بيانات محاكاة عالية الدقة للبصريات غير الخطية χ⁽²⁾
تعتمد مجموعة البيانات المستخدمة في هذه الدراسة على نموذج محاكاة كامل لعملية نظام الليزر المُشغَّل بواسطة المهبط الضوئي للمصدر المتماسك في مُسرِّع LCLS-II الخطي في مختبر SLAC. يتضمن هذا النظام مصدر ليزر يعمل بالأشعة تحت الحمراء مُقفل النمط بطول موجي 1035 نانومتر، ومُشكِّل طيفي قابل للبرمجة، ومُضخِّم نبضات مُعدَّل التردد، ووحدة تحويل تردد غير خطية (كما هو موضح في الشكل أ). ولتغطية نطاق واسع من أنماط النبضات،أنتجت الدراسة 10000 تكوين لتشكيل النبضات عن طريق أخذ عينات عشوائية من التشتت من الدرجة الثانية، والتشتت من الدرجة الثالثة، ومعلمات تشكيل السعة الطيفية.تم استخدام ما لا يقل عن 400 تكوين باستخدام تشكيل الطور فقط. ثم خضع كل تكوين لمحاكاة عالية الدقة باستخدام SSFM، مما أسفر في النهاية عن ثلاث نقاط بيانات حقل بصري مقترنة على 100 شريحة نقل في البلورة غير الخطية: SHG1 وSFG وSHG2، مع عدد نقاط أخذ عينات حقل واحد يبلغ 32768.

في مرحلة المعالجة المسبقة للبيانات، اعتمدت الدراسة عملية من ثلاث مراحل (كما هو موضح في الشكل ب أعلاه): المرحلة الأولى تقوم باقتطاع وتقليل عدد عينات المجال البصري في مجال التردد، مما يقلل المجال البصري SFG إلى 348 قيمة مركبة والمجالين البصريين SHG إلى 1892 قيمة مركبة على التوالي؛ المرحلة الثانية تقوم بدمج الأجزاء الحقيقية والخيالية لكل مجال بصري لتشكيل متجه ذي قيم حقيقية بطول ثابت يبلغ 8264 عنصرًا؛ المرحلة الثالثة تقوم بتطبيع جميع العناصر في المتجه إلى الفترة [0،1] بناءً على القيم القصوى لمجموعة البيانات العالمية.تم تقسيم مجموعة البيانات النهائية إلى 890,000 عينة تدريبية، و10,000 عينة للتحقق، و90,000 عينة اختبار.
بناء بنية نموذج وسيط تسلسلي قائم على LSTM
يستخدم نموذج LSTM بنية تسلسلية، حيث يتعامل مع كل شريحة منفصلة من البلورة غير الخطية كخطوة زمنية.تحتوي هذه الشبكة على 2048 وحدة مخفية، تليها ثلاث طبقات متصلة بالكامل بأبعاد (2048، 4096)، و(4096، 4096)، و(4096، 8264) على التوالي. تستخدم الطبقات الثلاث المتصلة بالكامل دوال التنشيط ReLU وTanh وSigmoid، كما هو موضح في الشكل أدناه.

مخطط بنية الشبكة والعمليات
يتم تحسين نموذج LSTM باستخدام مُحسِّن Adam ودالة خسارة متوسط مربع الخطأ المرجح (wMSE)، كما هو موضح في الشكل أدناه:

أثناء التدريب، يستخدم نموذج LSTM سلسلة من 10 شرائح مكانية كمدخلات للتنبؤ بالشريحة التالية. لكل مجموعة بيانات محاكاة تحتوي على 100 شريحة، يتم توليد 100 مجموعة من عينات الإدخال والإخراج عن طريق تحريك نافذة عبر السلسلة. تُضاف المجموعات التسع الأولى إلى بداية سلسلة الإدخال لضمان طول إدخال موحد. يكون شكل موتر تدريب الإدخال النهائي (حجم الدفعة: 10، 8264)، وشكل موتر الإخراج (حجم الدفعة: 8264).
يستخدم نموذج LSTM أسلوب الانحدار الذاتي للاستدلال.أولًا، تُكرر الشريحة الأولية عشر مرات كمدخل أولي. ثم يتنبأ نموذج LSTM بالشريحة التالية ويُلحقها بنهاية سلسلة المدخلات، مع تجاهل الشريحة الأولى في السلسلة، مع الحفاظ دائمًا على طول نافذة المدخلات عند 10. تُكرر هذه العملية دوريًا لإكمال الاشتقاق لجميع الخطوات المكانية المئة. وباستخدام نتائج تنبؤ نموذج السلسلة، يُعاد بناء عملية تطور الكميات الفيزيائية للمجال بأكمله داخل البلورة غير الخطية بشكل كامل.
تم تحسين كل من الدقة والكفاءة، مع زيادة في السرعة بمقدار 252 مرة مقارنة بالمحاكاة الأساسية.
لتقييم أداء الاستدلال لنموذج LSTM،تستخدم الدراسة مؤشر خطأ شامل يأخذ في الاعتبار كلاً من شكل الموجة وحساسية الطاقة الكلية.يتألف هذا المؤشر الشامل من ثلاثة مكونات لا أبعاد لها: تشابه جيب التمام للموجة المعيارية للمساحة، والذي يتم عكسه وتغيير مقياسه لضمان عدم وجود خطأ عندما تكون الموجات متطابقة تمامًا؛ متوسط الخطأ التربيعي المعياري (NMSE) المحسوب بناءً على شدة التكامل الكلية ويتناسب مع الطاقة، ويستخدم لمعاقبة عدم تطابق الطاقة؛ ومسافة Wasserstein (مسافة نقل الأرض، EMD) بين مجموعتي من منحنيات توزيع الشدة، والتي يمكنها اكتشاف إعادة التوزيع المحلي للشدة بدقة.
دقة إعادة بناء شكل الموجة
فيما يتعلق بالإعداد التجريبي، تقارب نموذج LSTM بعد حوالي 180 دورة تدريبية على وحدة معالجة رسومية واحدة من نوع NVIDIA A10G، بزمن تدريب يبلغ حوالي 160 ساعة. وبلغت خسارة التدريب النهائية وخسارة التحقق 2.05 × 10⁻⁵ و2.03 × 10⁻⁵ على التوالي. واعتمدت طريقة التقييم على حساب مؤشر الخطأ المُجمّع بين نتائج التنبؤ ونتائج محاكاة SSFM.
فيما يتعلق بالنتائج التجريبية، ولعرض التأثيرات النوعية بصريًا، رسمت الدراسة رسومًا بيانية وإحصائيات لمؤشرات خطأ شدة الإشارة الزمنية المجمعة لكل من SFG وSHG1 وSHG2 على التوالي. تم اختيار مجموعتين من بيانات الاختبار عشوائيًا من الأرباع الأربعة لتوزيع خطأ SFG. يُعرض في الشكل أدناه منحنيات الشدة المتوقعة والفعلية لـ SFG وSHG1 المقابل له في المجالين الزمني والترددي.

تُظهر مجموعتا الصور أدناه مثالين إضافيين من الربع الأعلى لتوزيع الخطأ، مما يُبرز أداء نموذج LSTM في ظل ظروف تشكيل مختلفة. تُشير النتائج إلى أن مؤشرات الخطأ المُجمعة للنموذجين هي 0.012 و0.003 على التوالي. في كلتا الحالتين،تستطيع نماذج LSTM إعادة بناء SFG وSHG1 بدقة في نطاق التردد أو الزمن. ولا يظهر انحراف SHG1 موضعيًا إلا عندما يكون سعة التعديل الطيفي كبيرة.توضح هذه الأمثلة أن نموذج LSTM يمكنه تحقيق تعميم جيد في ظل ظروف تشكيل طيفي متنوعة.


كفاءة الحساب النموذجية
يوضح الشكل أدناه وقت الاستدلال لنموذج LSTM في ظل أجهزة مختلفة: تعتمد المحاكاة الأساسية على نموذج SSFM، حيث يقوم SSFM بحل المصطلحات الرئيسية التي تستغرق وقتًا طويلاً عند حل الانتشار غير الخطي.على وجه التحديد، على وحدة معالجة مركزية أحادية النواة، تستغرق عملية المحاكاة الكاملة 1.98 ثانية، بينما تستغرق عملية SSFM حوالي 1.875 ثانية. يستغرق نموذج LSTM نفس الوقت تقريبًا الذي تستغرقه المحاكاة الأساسية على وحدة معالجة مركزية أحادية النواة، وذلك بسبب الحمل الزائد للمعالجة الدفعية؛ ومع ذلك، على وحدة معالجة رسومية واحدة NVIDIA A100 بحجم دفعة يبلغ 200، فإن وقت الاستدلال لعينة واحدة هو 7.43 مللي ثانية فقط، وهو أسرع بمقدار 252 مرة من المحاكاة الأساسية.

خاتمة
تستلهم هذه الدراسة من التجارب السابقة وتتضمن العديد من الأفكار المبتكرة، مثل نظام تقييم مركب ثلاثي يجمع بين تشابه جيب التمام العكسي، ومتوسط مربع الخطأ المعياري، وتحليل التحلل التجريبي للنمط. يُغيّر هذا النظام المؤشر الأحادي التقليدي، الذي لا يُمكن تكييفه مع التقييم البصري والعملي لتأثيرات أشكال النبضات المختلفة ومستويات الطاقة، مما يجعل النتائج التجريبية أكثر موثوقية ومصداقية.
بالطبع، تكمن أهم ميزة أساسية لتقنية LSTM في تحويلها الكامل لنموذج SSFM التقليدي، الذي يتطلب تحويلات متكررة في مجال التردد الزمني، مما يؤدي إلى تكاليف حسابية عالية. بينما تحتاج LSTM فقط إلى تعلم علاقة الربط مباشرةً في مجال التردد المبسط، مما يلغي الحاجة إلى تحويلات فورييه المتكررة خطوة بخطوة، ويتيح الاشتقاق في الوقت الفعلي. علاوة على ذلك، بالإضافة إلى عمليات SFG، يمكن تطبيق نماذج LSTM على سيناريوهات بصرية غير خطية من الدرجة الثانية متنوعة، مما يمنحها إمكانات تطبيق واسعة النطاق، ويلبي احتياجات التطبيقات التجريبية والعملية الحالية.
وأخيرًا، يكشف التحقق الناجح من نموذج LSTM عن القدرة التمكينية عالية الكفاءة لنماذج التعلم الآلي في مجال المحاكاة البصرية غير الخطية، مما يؤدي إلى كسر الحواجز بين المحاكاة العددية البحتة والتجارب الفيزيائية، ويوفر نموذجًا تقنيًا جديدًا لتصميم أنظمة إلكترونية ضوئية فعالة وواسعة النطاق وذكية.








