دمج تآزري لسمات الرسم البياني والمحول لتحسين توقع خصائص الجزيئات

تُعد تنبؤ الخصائص الجزيئية مهمة حاسمة في اكتشاف الأدوية الحاسوبي. وعلى الرغم من التقدم الأخير في الشبكات العصبية الرسومية (GNNs) ونماذج Transformers، التي أظهرت كفاءة واعدة، إلا أنها تواجه القيود التالية: لا يأخذ انتباه التحويل (self-attention) في Transformers بعين الاعتبار بشكل صريح البنية الجزيئية الكامنة، في حين أن تمثيل الميزات من GNN وحده لا يكفي لالتقاط التفاعلات والخصائص الدقيقة والخفية التي تميز الجزيئات الشبيهة. ولحل هذه القيود، نقترح منهجًا جديدًا يُسمى SYN-FUSION، الذي يُطبّق تكاملًا متناسقًا بين السمات المُدرّبة مسبقًا من GNNs وTransformers. يوفر هذا النهج تمثيلًا جزيئيًا شاملاً، يلتقط كلاً من البنية الجزيئية الشاملة والخصائص الفردية للذرات. أظهرت النتائج التجريبية على مجموعات بيانات MoleculeNet أداءً متفوقًا، حيث تفوق النموذج السابق في 5 من أصل 7 مجموعات بيانات تصنيف، وفي 4 من أصل 6 مجموعات بيانات انحدار. وتم مقارنة أداء SYN-FUSION مع نماذج أخرى من نوع Graph-Transformer التي تم تدريبها بشكل مشترك باستخدام مزيج من ميزات Transformer وشبكات الرسم، وتبين أن أسلوبنا يوازي هذه النماذج من حيث الأداء. كما أثبت التحليل المعمق للنموذج المُدمج المُدرّب، من خلال جوانب مثل دالة الخسارة، والفضاء الخفي، وتوزيع الأوزان، فعالية SYN-FUSION بشكل قاطع. وأخيرًا، أظهرت دراسة الاستبعاد (ablation study) بشكل لا لبس فيه أن التآزر الناتج عن SYN-FUSION يفوق أداء المكونات الفردية للنموذج، وكذلك أداء مجموعتها المجمعة، مما يوفر تحسينًا كبيرًا في تنبؤ الخصائص الجزيئية.