HyperAIHyperAI
منذ 2 أشهر

GemNet-OC: تطوير شبكات العصب الرسمية للبيانات الكبيرة والمتنوعة في محاكاة الجزيئات

Johannes Gasteiger; Muhammed Shuaibi; Anuroop Sriram; Stephan Günnemann; Zachary Ulissi; C. Lawrence Zitnick; Abhishek Das
GemNet-OC: تطوير شبكات العصب الرسمية للبيانات الكبيرة والمتنوعة في محاكاة الجزيئات
الملخص

في السنوات الأخيرة، شهدنا ظهور مجموعات بيانات المحاكاة الجزيئية التي تفوق بمراحل في الحجم والتنوع. تختلف هذه المجموعات الجديدة من البيانات بشكل كبير في أربعة جوانب من التعقيد: 1. التنوع الكيميائي (عدد العناصر المختلفة)، 2. حجم النظام (عدد الذرات لكل عينة)، 3. حجم مجموعة البيانات (عدد عينات البيانات)، و4. التحول النمطي (تشابه مجموعة التدريب ومجموعة الاختبار). على الرغم من هذه الفروقات الكبيرة، لا تزال المعايير على مجموعات البيانات الصغيرة والضيقة هي الطريقة السائدة لبيان التقدم في الشبكات العصبية الرسومية (GNNs) لمحاكاة الجزيئات، ربما بسبب متطلبات الحوسبة الأرخص للتدريب. هذا يثير السؤال -- هل يمكن أن يترجم التقدم في الشبكات العصبية الرسومية على مجموعات البيانات الصغيرة والضيقة إلى هذه المجموعات الأكثر تعقيدًا؟يتناول هذا البحث هذا السؤال من خلال تطوير نموذج GemNet-OC اعتمادًا على مجموعة بيانات Open Catalyst 2020 (OC20) الكبيرة. حقق GemNet-OC تفوقًا بنسبة 16% على أفضل ما سبقه من تقنيات في OC20 مع تقليل وقت التدريب بعشرة أضعاف. ثم قارنا تأثير 18 مكونًا للنموذج واختيارات البارامترات الفائقة على الأداء في عدة مجموعات بيانات. وجدنا أن النموذج الناتج سيختلف بشكل كبير اعتمادًا على مجموعة البيانات المستخدمة لصنع اختيارات النموذج.لعزل مصدر هذا الاختلاف، درسنا ستة فروع لمجموعة بيانات OC20 التي تستعرض كل جانب من الجوانب الأربعة المذكورة أعلاه بشكل فردي. وجدنا أن النتائج على فرع OC-2M تتداخل بشكل جيد مع مجموعة بيانات OC20 الكاملة بينما تكون أرخص بكثير للتدريب عليها. تحدي نتائجنا الممارسة الشائعة لتطوير الشبكات العصبية الرسومية فقط على مجموعات البيانات الصغيرة، ولكنها تسليط الضوء على طرق تحقيق دورة تطوير سريعة ونتائج قابلة للتعميم عبر مجموعات بيانات متوسطة الحجم وممثلة مثل OC-2M وأنماط كفاءة مثل GemNet-OC.تم توفير شفرتنا وأوزان النموذج المدرب مسبقًا كمصدر حر.注释:- "graph neural networks" 翻译为 "الشبكات العصبية الرسومية" (GNNs).- "Open Catalyst 2020" 翻译为 "Open Catalyst 2020" (OC20),保留英文名称以确保准确性。- "GemNet-OC" 翻译为 "GemNet-OC",保留英文名称以确保准确性。- "hyperparameter choices" 翻译为 "اختيارات البارامترات الفائقة".- "domain shift" 翻译为 "التحول النمطي".

GemNet-OC: تطوير شبكات العصب الرسمية للبيانات الكبيرة والمتنوعة في محاكاة الجزيئات | أحدث الأوراق البحثية | HyperAI