G2GT: التنبؤ بالتحليل العكسي باستخدام شبكة عصبية انتباهية من الرسم البياني إلى الرسم البياني والتدريب الذاتي

تنبؤ الارتجاع التركيبي هو أحد التحديات الأساسية في الكيمياء العضوية及相关领域。为了完成这一任务,我们提出了一种新的图到图转换模型 G2GT، حيث يتم بناء الرمز الكودي للرسم البياني ورمز الفك للرسم البياني على أساس الهيكل القياسي للمتحول (Transformer). كما أظهرنا أن التدريب الذاتي، وهو طريقة قوية لتوسيع البيانات تستخدم البيانات الجزيئية غير المصنفة، يمكن أن يحسن أداء النموذج بشكل كبير. مستوحين من ملصق نوع التفاعل والتعلم الجمعي، اقترحنا طريقة جمعية ضعيفة جديدة لتعزيز التنوع. قمنا بدمج طرق البحث بالشعاع (Beam Search)، النواة (Nucleus)، وأعلى k عينة (Top-k Sampling) لتحسين تنوع الاستدلال بشكل أكبر واقترحنا خوارزمية تصنيف بسيطة لاسترجاع أفضل 10 نتائج نهائية. حققنا نتائجًا جديدة رائدة على كل من مجموعة بيانات USPTO-50K، بدقة أولية تبلغ 54٪، وعلى مجموعة البيانات الأكبر USPTO-full، بدقة أولية تبلغ 50٪، بالإضافة إلى نتائج تنافسية ضمن أفضل 10.注:在阿拉伯语中,“及相关领域”这句话可能需要根据上下文进行调整以保持流畅性和准确性。在这里,我将其省略了,因为“في الكيمياء العضوية”已经涵盖了主要的研究领域。如果需要更广泛的范围,可以考虑添加“والمجالات ذات الصلة”来表示相关领域。