Command Palette
Search for a command to run...
مجموعة بيانات معيار الأداء NWChem_Benchmark
مجموعة بيانات NWChem المعيارية هي مجموعة من سيناريوهات اختبار الأداء القياسية المصممة خصيصًا لبرامج NWChem للكيمياء الكمومية والمحاكاة الجزيئية في بيئات الحوسبة عالية الأداء (HPC). تغطي هذه المجموعة، المُولّدة بواسطة برنامج NWChem للكيمياء الحسابية عالية الأداء، بيانات حسابية هجينة كمية وكلاسيكية للجزيئات الحيوية، والبنى النانوية، ومواد الحالة الصلبة. تتضمن خصائص الحالة الأرضية والحالة المثارة، وتستخدم كلاً من دالة غاوس وأساليب حساب الموجة المستوية، وتتميز بقابلية توسع متوازية عالية من عقدة واحدة إلى آلاف المعالجات. كما تدعم تحليل الخصائص الجزيئية والتأثيرات النسبية.
تم نشر ورقة البحث ذات الصلة، بعنوان "NWChem: الماضي والحاضر والمستقبل"، في عام 2020 من قبل مختبر المحيط الهادئ الشمالي الغربي الوطني بالتعاون مع مختبر لورانس بيركلي الوطني، والمركز الوطني للعلوم الحاسوبية، ومؤسسات أخرى.
بنية مجموعة البيانات
يتضمن الهيكل الأساسي لهذه المجموعة من البيانات ما يلي:
- نصوص الإدخال ونتائج الإخراج: يأتي كل سيناريو معياري مع ملف إدخال حسابي قابل للتكرار (.nw) وسجلات الإخراج/بيانات التوقيت المقابلة (بما في ذلك ساعة الحائط، ووقت وحدة المعالجة المركزية، والتسريع).
- الهندسة المتوازية: تتضمن تكوينات وقت التشغيل مع أعداد مختلفة من المعالجات والأوضاع المتوازية (MPI + OpenMP أو MPI النقي) لتحليل قابلية التوسع في الأداء.
- طرق كيميائية متعددة: تتضمن وحدات حسابية مثل ديناميكيات الجزيئات (MD)، والحقل المتسق ذاتيًا (SCF)، ونظرية الكثافة الوظيفية (DFT)، ونظرية الاضطرابات من الدرجة الثانية (MP2).
- وصف بيئة التشغيل المرجعية: حدد منصة الحوسبة الفائقة المستخدمة في الحوسبة (مثل IBM SP2، Cray T3E-900)، وعدد العقد، وعدد النوى، ووقت الجدار، وما إلى ذلك.
- الصور ومنحنيات الأداء: يتم إرفاق رسم بياني للأداء (.gif، .jpg) بكل مشهد، والذي يوضح مقاييس مثل التسريع ووقت وحدة المعالجة المركزية واستخدام القرص.
- تنزيل أمثلة وإعادة إنتاج الإدخال: يمكن إعادة إنتاج كافة مهام المعايير عن طريق تنزيل ملفات الإدخال المقابلة (مثل had_md.nw، siosi3.nw، h2o7.nw، وما إلى ذلك).
مثال على محتوى مجموعة البيانات
وفيما يلي بعض محتويات المعايير النموذجية:
- أنظمة الماء السائل (الديناميكيات الجزيئية):
تم إجراء عمليات محاكاة ديناميكية جزيئية على أنظمة تحتوي على 5184 و17496 و41472 و82000 ذرة، باستخدام نموذج الماء SPC/E بنصف قطر قطع 1.8 نانومتر، وتشغيلها على IBM SP2.
يوضح المحاكاة قابلية التوسع المتوازية لنظام الماء السائل، حيث تظهر أن كل معالج يحتاج إلى التعامل مع ما يقرب من 100 ذرة لتحقيق قابلية التوسع الجيدة.
تظهر النتائج أن الحفاظ على حمل حسابي معقول يعد أمرا بالغ الأهمية لتحقيق الكفاءة في الحوسبة المتوازية الضخمة. - حساب الطاقة الحرة لمجمع الأثير التاجي Na⁺/K⁺:
تم تشغيل النظام المحتوي على 6382 ذرة على IBM SP2 و Cray T3E-900 لحساب الطاقات الحرة النسبية لأيونات Na⁺ و K⁺ في المحلول المائي وفي حالتها المعقدة مع إيثر التاج 18-6.
تم حساب فرق الطاقة الحرة المركبة ليكون تقريبًا 6 ± 4 كيلو جول / مول باستخدام طريقة التكامل الديناميكي الحراري متعدد التكوين (MCTI) (أنتج حساب آخر 5 ± 5 كيلو جول / مول)، بما يتفق مع القيمة التجريبية 7 كيلو جول / مول.
وتوضح النتائج وقت التشغيل والأداء المتوازي للنظام على منصات مختلفة. - محاكاة إنزيم هالو ألكان ديهالوجينيز:
يحتوي النظام على 41259 ذرة ويستخدم مجال قوة AMBER مع تصحيح Ewald (PME) ونصف قطر قطع يبلغ 1.0 نانومتر.
تم إجراء عمليات محاكاة ديناميكية جزيئية للإنزيم في المحلول المائي على جهاز IBM SP، مع إجراء تصحيحات طويلة المدى للطاقة والقوة الكهروستاتيكية باستخدام شبكة 64³.
تظهر النتائج سلوكًا جيدًا للتسارع المتوازي وتوفر ملفات إدخال يمكن تشغيلها مباشرة (had_md.nw، had.top.gz، had_md.rst.gz). - قطرات 1,2- ثنائي كلورو الإيثان:
تم استخدام نظام يحتوي على 100,369 ذرة لمحاكاة سلوك قطرات الملوثات.
وباستخدام معلمات مجال قوة كلورو ألكان بولسن ونموذج الماء SPC/E، مع نصف قطر قطع يبلغ 2.4 نانومتر، تم إجراء التجربة على IBM SP وCray T3E-900 على التوالي.
تُظهر عمليات المحاكاة مقارنة الأداء وقابلية التوسع لقطرات 1،2- ثنائي كلورو الإيثان على منصات مختلفة.
الأوكتانول السائل:
يحتوي نظام المحاكاة على 216000 ذرة، ويستخدم مجال قوة AMBER ونموذج الماء SPC/E، وله نصف قطر قطع يبلغ 2.4 نانومتر.
من خلال التشغيل على Cray T3E-900، تم إثبات التسارع الخطي وقابلية التوسع الجيدة لنظام الأوكتانول السائل في ظل ظروف متوازية واسعة النطاق.
- اختبار أداء SCF:
تم إجراء الحوسبة شبه المباشرة لتدفق البيانات الموزعة (DDSCF) على IBM SP (عقدة 150 ميجا هرتز) لفحص تسريع وحدة المعالجة المركزية واستخدام القرص مع زيادة عدد عقد المعالج.
تظهر النتائج أن استخدام القرص يتزايد بشكل متناسب مع الموارد المتاحة، مما يؤكد قابلية توسع وحدة SCF في بيئة موزعة. - معيار DFT (SIOSI3/6/7):
تم إجراء حسابات LDA على ثلاثة أنظمة من شظايا الزيوليت (تحتوي على 347 و 1687 و 3554 دالة أساسية على التوالي) لتقييم قابلية التوسع لوحدة نظرية الكثافة الوظيفية.
توفير ملفات الإدخال (siosi3.nw، siosi6.nw، siosi7.nw) للتجارب القابلة للتكرار، والتي تتطلب إجراء العمليات الحسابية بالكامل في الذاكرة (داخل النواة).
يمكن التحقق من استخدام الذاكرة عن طريق البحث عن الكلمة الأساسية "in-core" في ملف الإخراج، وتظهر نتائج الحساب تسارعًا متوازيًا متعدد المعالجات جيدًا. - حساب تدرج MP2:
تم إجراء حسابات تدرج MP2 على جزيء (H₂O)₇ ونظام إيثر تاج البوتاسيوم لتحليل توزيع وقت وحدة المعالجة المركزية تحت أعداد مختلفة من المعالجات.
تم إجراء الحسابات على IBM SP (عقدة 120 ميجا هرتز)، مما يوضح نسبة وقت الحساب لكل جزء.
يتم توفير ملف إدخال قابل للتكرار، h2o7.nw، لمزيد من اختبارات الأداء.
نصائح الاستخدام
- لإجراء مقارنات الأداء، يرجى تسجيل عدد العقد/النوى، ووقت الجدار، والتكوين الموازي (MPI×OpenMP) لضمان مقارنة عادلة.
- قبل التشغيل، يرجى الرجوع إلى ملف الإدخال ووثيقة README المقابلة لكل سيناريو معياري للتأكد من أن الإدخال متسق وأن المعلمات كاملة.
- يمكن استخدام المعيار المرجعي لـ:
- التحقق من صحة منصة الأجهزة الجديدة: تقييم أداء NWChem في بيئات مثل وحدة معالجة الرسوميات والأنظمة الهجينة والمعجلات.
- تقييم التحسين المتوازي: تأثير الأداء لخيارات التجميع المختلفة، ونموذج اتصال MPI، وجدولة الذاكرة.
- دراسة مقارنة للبرمجيات: مقارنة الأداء مع برامج الكيمياء الكمومية الأخرى (مثل Gaussian، CP2K، ORCA) على أنظمة مماثلة.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.