HyperAIHyperAI
منذ 2 أشهر

شبكة محاذاة النمط العدواني للبحث عن الجزيئات عبر النماذج

{Jinjun Chen, Kai Zhang, Buqing Cao, Dong Zhou, Wenyu Zhao}
شبكة محاذاة النمط العدواني للبحث عن الجزيئات عبر النماذج
الملخص

تهدف مهمة استرجاع الجزيئات عبر الوسائط (Text2Mol) إلى سد الفجوة الدلالية بين الجزيئات والوصف باللغة الطبيعية. تعتمد الحلول المقدمة لهذا المشكلة غير البسيطة على شبكة الت convolution الرسومية (GCN) والانتباه عبر الوسائط مع التعلم التبايني لتحقيق نتائج معقولة. ومع ذلك، توجد مشكلات رئيسية تتمثل في: 1) آلية الانتباه عبر الوسائط تفضّل تمثيلات النص فقط، ولا تقدم معلومات مفيدة لتمثيلات الجزيئات. 2) يتجاهل مشفر الجزيئات القائم على GCN ميزات الحواف، ويُهمل أهمية الهياكل الفرعية المختلفة للجزيء. 3) دالة خسارة استرجاع المعلومات بسيطة نسبيًا. تبحث هذه الورقة بشكل أعمق في مشكلة Text2Mol، وتقترح طريقة جديدة تعتمد على شبكة التوافق الوسائطي المضادة (AMAN) لتعلم كلاً من المعلومات الوصفية والجزيئية بشكل شامل. تعتمد طريقة العمل لدينا على استخدام SciBERT كمشفر للنص، وشبكة الرسوم المتحولة (Graph Transformer) كمشفر للجزيئات لإنشاء تمثيلات متعددة الوسائط. ثم يتم استخدام شبكة مضادة للتوافق بين الوسائط بشكل تفاعلي. وفي الوقت نفسه، تُستخدم دالة خسارة ثلاثية (triplet loss) لتنفيذ التعلم المتعلق باسترجاع المعلومات، وتعزيز التوافق بين الوسائط بشكل أكبر. أظهرت التجارب على مجموعة بيانات ChEBI-20 فعالية طريقة AMAN مقارنة بالأساليب الأساسية.