Command Palette
Search for a command to run...
مجموعة بيانات تقييم أداء الديناميكيات الجزيئية Amber_Benchmark
يشير مصطلح Amber إلى بناء النموذج بمساعدة تحسين الطاقة.
مجموعة بيانات Amber Benchmark هي مجموعة من مدخلات معايير الأداء وملفات التكوين، مصممة خصيصًا لبيئات الحوسبة عالية الأداء (HPC). تُستخدم لاختبار ومقارنة كفاءة وقابلية توسع برنامج Amber Molecular Dynamics عبر مجموعة متنوعة من الأجهزة والبنى المتوازية.
بخلاف بيانات التجارب العلمية أو نتائج المحاكاة، تحتوي مجموعة البيانات هذه على حزم إدخال وتكوين موحدة تُستخدم لقياس الأداء الحسابي (السرعة، وقابلية التوسع، والكفاءة) للنظام، بدلاً من مخرجات المحاكاة للتحليل العلمي. جميع معايير الأداء (مثل DHFR، وFactor IX، وCellulose، وSTMV، وغيرها) تأتي مع ملفات إدخال موحدة ونتائج أداء مرجعية، والتي يمكن تشغيلها بشكل متكرر على منصات مختلفة لوحدات معالجة الرسومات أو وحدات المعالجة المركزية للتحقق من الأداء.
نتائج الورقة ذات الصلة هيالتطورات الحديثة في محاكاة الجزيئات الحيوية العنبرنُشرت مجموعة البيانات، المعنونة "..."، عام ٢٠٢٥ بواسطة ديفيد أ. كيس وآخرين. الإصدار الحالي من هذه المجموعة هو "...".Amber24: معلومات أداء pmemd.cuda".
بنية مجموعة البيانات
توفر Amber مجموعتين متكاملتين من المعايير المرجعية:
- مجموعة ووكر الأساسية
- تم إنشاؤه بواسطة الدكتور روس سي ووكر، وكان أحد أقدم معايير تقييم الأداء لوحدة معالجة الرسوميات Amber (pmemd.cuda).
- منذ عام 2010، قامت بتغطية إصدارات متعددة وهندسة وحدة معالجة الرسوميات (Fermi → Ampere → Hopper → Blackwell).
- إنه يتضمن العديد من المعماريات التمثيلية (JAC، Factor IX، Cellulose، STMV، وما إلى ذلك) لمقارنة سرعة التشغيل (ns/day) لوحدات معالجة الرسوميات المختلفة.
- مجموعة معايير سيروتي
- تم تصميمه بواسطة الدكتور ديف سيروتي، ويستخدم إعدادات محاكاة حديثة وواقعية (العنبر 18-20-24).
- ويشمل أربعة أنظمة دورية: DHFR، والعامل التاسع، والسليلوز، وSTMV (23K–1.1M ذرة).
- يدعم مجموعات NVE/NPT بخطوة زمنية تبلغ 4 fs ونصف قطر قطع يبلغ 9 Å.
- ويقدم وضعين للتشغيل: "الافتراضي" و"التعزيز"، حيث يعمل الوضع الأخير على تحسين الأداء بنحو 10%.
بالإضافة إلى ذلك، تتضمن مجموعة البيانات أيضًا أنظمة معيارية للمذيبات الضمنية (GB)، مثل Trp Cage، وMyoglobin، وNucleosome، لتقييم أداء المحاكاة غير الدورية.
مثال على محتوى مجموعة البيانات
- مجموعة معايير ووكر (معيار وحدة معالجة الرسومات التقليدية)
أمثلة نموذجية للهندسة المعمارية والأداء (تعمل على وحدة معالجة رسومية واحدة)
| اسم النظام | عدد الذرات | مسلسل | طول الخطوة | نموذج وحدة معالجة الرسومات | الأداء (ns/day) | يوضح |
|---|---|---|---|---|---|---|
| إنتاج جاك | 23,558 | NVE/NPT | 4 في الثانية | RTX 4090 | 1638 / 1618 | تقدم أنظمة البروتين الصغيرة أعلى أداء، حيث تصل إلى أكثر من 1600 نانوثانية/يوم. |
| إنتاج العامل التاسع | 90,906 | NVE/NPT | 2 ثانية | RTX 4090 | 466 / 433 | نظام بروتين صندوق الماء الكبير لاختبار كفاءة اتصال PME |
| إنتاج السليلوز | 408,609 | NVE/NPT | 2 ثانية | RTX 4090 | 129 / 119 | أنظمة البوليمر لتقييم التفاعلات طويلة المدى وأداء التحلل المتوازي |
| إنتاج STMV | 1,067,095 | معاهدة حظر الانتشار النووي | 4 في الثانية | RTX 4090 | 78.9 | نظام فيروسات التبغ الفضائية، اختبار الحمل المتوازي على نطاق واسع للغاية |
- في أحدث وحدات معالجة الرسوميات Blackwell B200، يتفوق برنامج "Walker" من Amber24 على A100/H100 في الأنظمة الصغيرة ويحافظ على تقدمه في الأنظمة الكبيرة.
- مجموعة معايير سيروتي (التقييم المعياري الحديث المُحسَّن)
أمثلة نموذجية للهندسة المعمارية والأداء (وحدة معالجة الرسومات V100، Amber 20)
| اسم النظام | عدد الذرات | مسلسل | نموذج | الأداء (ns/day) | يوضح |
|---|---|---|---|---|---|
| دي اتش اف ار (جاك) | 23,588 | NVE/NPT | افتراضي / تعزيز | 934 / 1059 | أنظمة البروتين الصغيرة، نقاط مرجعية قياسية |
| العامل التاسع | 90,906 | NVE/NPT | افتراضي / تعزيز | 365 / 406 | اختبار توازن النظام متوسط الحجم والاتصالات وقابلية التوسع |
| السليلوز | 408,609 | NVE/NPT | افتراضي / تعزيز | 88.9 / 96.2 | أنظمة عديد السكاريد واسعة النطاق، وسيناريوهات ضغط ذاكرة وحدة معالجة الرسومات والنطاق الترددي |
| إس تي إم في | 1,067,095 | NVE/NPT | افتراضي / تعزيز | 30.4 / 33.5 | نظام فيروس المليون ذرة، تقييم الأداء المتوازي الشديد |
- يقدم Amber 20 خوارزميات تحسين "قائمة الزوج المتسرب" و"تصحيح القوة الصافية"، والتي تعمل على تقليل العبء الحسابي بما يقرب من 31 TP3T مع الحفاظ على الحفاظ على الطاقة.
- مجموعة مرجعية للمذيبات الضمنية (GB)
مثال نموذجي للهندسة المعمارية والأداء (وحدة معالجة الرسومات V100، Amber 20، 4 إطارات في الثانية)
| اسم النظام | عدد الذرات | نموذج | الأداء (ns/day) | يوضح |
|---|---|---|---|---|
| قفص Trp | 304 | بريطانيا العظمى | 2801 | نموذج طي بروتين صغير ذو أداء ذروة يبلغ >2800 نانوثانية/يوم |
| الميوغلوبين | 2,492 | بريطانيا العظمى | 1725 | نظام بروتين أحادي السلسلة متوسط الحجم ذو أداء مستقر |
| النوكليوسوم | 25,095 | بريطانيا العظمى | 48.5 | نظام وحدة الكروماتين الكبيرة لاختبار الحفاظ على الطاقة وسعة الإنتاج |
- يمكن لنموذج GB تحسين معدل أخذ العينات بشكل كبير بعد إزالة احتكاك المذيبات الصريح، مما يجعله مناسبًا لاستكشاف سطح الطاقة السريع.
نظرة عامة على مقارنة الأداء وقابلية التوسع
- الأنظمة الصغيرة (≤ 30 ألف ذرة): يتأثر الأداء بشكل أساسي بسرعة ساعة وحدة معالجة الرسومات ونطاق الذاكرة بسبب العدد المحدود من المهام المتوازية.
- الأنظمة متوسطة الحجم (≈ 100 كلفن ذرة): الوصول إلى ذروة استخدام وحدة معالجة الرسوميات، وهو ما يمثل نطاق الأداء الأمثل لمعظم الأنظمة البيولوجية في العالم الحقيقي.
- الأنظمة الكبيرة (≥ 400 كلفن ذرة): تزداد تكاليف الاتصال والذاكرة، وينخفض الأداء تدريجيًا مع زيادة حجم النظام.
- نظام بمقياس مليون ذرة: يمكن لـ Amber 24 الحفاظ بشكل ثابت على أداء يبلغ >130 ns/day على وحدة معالجة رسومية B200 واحدة، مما يوضح قابلية التوسع المتوازي الجيدة.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.