HyperAIHyperAI
منذ 17 أيام

DiffMS: توليد الجزيئات باستخدام التشتت المشروط بالطيف الكتلي

Montgomery Bohde, Mrunali Manjrekar, Runzhong Wang, Shuiwang Ji, Connor W. Coley
DiffMS: توليد الجزيئات باستخدام التشتت المشروط بالطيف الكتلي
الملخص

تلعب الطيف الكتلي دورًا جوهريًا في فهم تركيب الجزيئات غير المعروفة والاكتشافات العلمية اللاحقة. أحد صيغ مهمة تحديد التركيب هو توليد جزيئي جديد شرطيًا بناءً على طيف كتلي معطى. من أجل تحسين دقة وكفاءة سلسلة الاكتشاف العلمي الخاصة بالجزيئات الصغيرة، نقدم نموذج DiffMS، وهو شبكة توليدية محدودة الصيغة تعتمد على هيكل مُشفر-مُفكك، وتُظهر أداءً متميزًا على هذا المهمة. يستخدم المُشفر بنية مُحول (Transformer) لتمثيل معرفة مجال الطيف الكتلي، مثل صيغ القمم وفقدان الجزيئات المحايدة، بينما يُعد المُفكك نموذجًا تبديديًا للرسم البياني المنفصل، مُقيدًا بتكوين الذرات الثقيلة لصيغة كيميائية معروفة. لتطوير مُفكك قوي يربط بين التضمينات المُخزنة والتركيبات الجزيئية، قمنا بتدريب مُسبق للنموذج التبديدي باستخدام أزواج "بصمة-تركيب"، والتي تتوفر بكميات شبه لا نهائية، مقارنةً بأزواج التركيب-الطيف التي تبلغ عشرات الآلاف فقط. أظهرت التجارب الواسعة على معايير مثبتة أن DiffMS يتفوق على النماذج الحالية في توليد الجزيئات من الصفر. ونقدّم عدة تحليلات تبيّن فعالية نهجنا التبديدي والتدريب المسبق، كما نُظهر تحسّنًا مستمرًا في الأداء مع زيادة حجم مجموعة التدريب المسبق. يمكن الوصول إلى كود DiffMS عبر الإنترنت عبر الرابط: https://github.com/coleygroup/DiffMS.

DiffMS: توليد الجزيئات باستخدام التشتت المشروط بالطيف الكتلي | أحدث الأوراق البحثية | HyperAI