HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 4 أشهر

MolReFlect: نحو محاذاة دقيقة داخل السياق بين الجزيئات والنصوص

{Qing Li Yuqiang Li Dongzhan Zhou Wenqi Fan Di Zhang Jingdi Lei Wei Liu Yunqing Liu Jiatong Li}

MolReFlect: نحو محاذاة دقيقة داخل السياق بين الجزيئات والنصوص

الملخص

يُعد اكتشاف الجزيئات مجالًا بحثيًا محوريًا، ويؤثر على كل شيء من الأدوية التي نتناولها إلى المواد التي نستخدمها. في الآونة الأخيرة، تم اعتماد نماذج اللغة الكبيرة (LLMs) على نطاق واسع في فهم وتكوين الجزيئات، لكن التوافق بين الجزيئات ووصفها النصي ما زال يمثل تحديًا كبيرًا. عادةً ما تتعامل الجهود السابقة مع الجزيء كسلسلة SMILES عامة أو كرسم بياني جزيئي، مع إغفال التوافق الدقيق بين الهياكل الجزئية للجزيئات والعبارات النصية الوصفية، والتي تُعدّ حاسمة لتحقيق تنبؤات دقيقة وقابلة للتفسير. في هذا السياق، نقدّم MolReFlect، وهي إطار جديد من نوع "المعلم والطالب" مصمم لتنفيذ التوافق بين الجزيئات والنصوص الوصفية بطريقة دقيقة ومُتَعَلِّقة بالسياق. تعتمد طريقة عملنا أولاً على نموذج لغة كبير (معلم) لوضع العلامات على التوافق التفصيلي من خلال استخراج مباشرة للعبارات المهمة من وصف الجزيء أو سلسلة SMILES، وربطها بالهياكل الجزئية أو الخصائص المقابلة. لتحسين هذه التوافقات، نقترح تقنية "الانعكاس المُنتقى في السياق"، التي تسترجع نتائج الاستخراج السابقة كأمثلة سياقية، مما يسمح لنموذج المعلم بالانعكاس عليها، ويُتيح لنموذج الطالب الصغير اختيار النتائج الأنسب من بين الانعكاسات السياقية والنتائج السابقة. وأخيرًا، نعزز عملية التعلّم لنموذج الطالب من خلال تقنية "الضبط الجزيئي السياقي بسلسلة التفكير" (Chain-of-Thought In-Context Molecule Tuning)، التي تدمج التوافقات الدقيقة مع عمليات التفكير ضمن هيكل سلسلة التفكير. تُظهر النتائج التجريبية أن MolReFlect تمكّن نماذج مثل Mistral-7B من التفوق بشكل كبير على النماذج السابقة، وتحقيق أداءً رائدًا (SOTA) على مجموعة بيانات ChEBI-20. ويمثل هذا التقدم تحسينًا كبيرًا في القدرات الإنشائية لنموذج اللغة الكبيرة في مهام الترجمة بين الجزيئات والنصوص الوصفية، كما يسهم في بناء إطار أكثر شفافية وقابلية للتفسير.

المعايير القياسية

معيار قياسيالمنهجيةالمقاييس
molecule-captioning-on-chebi-20MolReFlect
BLEU-2: 67.6
BLEU-4: 60.8
METEOR: 68.0
ROUGE-1: 70.3
ROUGE-2: 57.1
ROUGE-L: 64.4
text-based-de-novo-molecule-generation-onMolReFlect
BLEU: 90.3
Exact Match: 51.0
Levenshtein: 11.84
MACCS FTS: 92.9
Morgan FTS: 81.3
RDK FTS: 86.0
Validity: 97.7

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
MolReFlect: نحو محاذاة دقيقة داخل السياق بين الجزيئات والنصوص | الأوراق البحثية | HyperAI