البصمات الجزيئية هي نماذج قوية لتنبؤ وظائف الببتيدات

ندرس فعالية بصمات الجزيئات في التنبؤ بخصائص الببتيدات ونثبت أن استخراج الخصائص المحددة للمنطقة من الرسومات الجزيئية يمكن أن يتفوق على النماذج المعقدة والمرتفعة التكلفة حاسوبيًا مثل شبكات العصب المتجردة (GNNs)، المحولات المدربة مسبقًا المستندة إلى التسلسل، والensembles متعددة الأوضاع، حتى بدون ضبط المعلمات الفائقة. لهذا الغرض، نقوم بتقييم شامل على 126 مجموعة بيانات، حيث نحقق أفضل النتائج الحالية في LRGB وفي خمسة مقاييس أخرى للتنبؤ بوظائف الببتيدات. نوضح أن النماذج المستندة إلى متغيرات العد من بصمات ECFP، الالتواء الطوبولوجي (Topological Torsion)، وبصمات RDKit الجزيئية مع LightGBM كرأس تصنيف هي ملحوظة في قوة تحملها. الأداء القوي لبصمات الجزيئات، والتي تعد بطبيعتها مرمزةً للخصائص القريبة جدًا، يتحدى الأهمية المفترضة للتفاعلات البعيدة المدى في الببتيدات. استنتاجنا هو أن استخدام بصمات الجزيئات للأجسام الكبيرة مثل الببتيدات يمكن أن يكون بديلًا حاسوبيًا قابلًا للتنفيذ، ذو عدد معلمات قليل، ومتنوع بدلاً من نماذج التعلم العميق المعقدة.注释:- "ensembles" 翻译为 "ensembles" 是因为它在科技领域中通常保留英文形式。- "LRGB" 保持原样,因为它是一个特定的基准名称。- "ECFP" 和 "RDKit" 也保持原样,因为它们是特定的技术术语。