تحليل التمثيلات الجزيئية المكتسبة للتنبؤ بالخصائص

التقدم في الآلات العصبية أدى إلى مجموعة واسعة من الحلول الخوارزمية لتنبؤ خصائص الجزيئات. وقد أظهرت فئتان من النماذج نتائجًا واعدة بشكل خاص: الشبكات العصبية المطبقة على البصمات الجزيئية الحاسوبية أو الوصفات المصممة بخبرة، والشبكات العصبية التلافيفية الرسومية التي تبني تمثيلًا جزيئيًا متعلمًا من خلال العمل على بنية الرسم البياني للجزيء. ومع ذلك، فإن الأدبيات الحديثة لم تحدد بعد بشكل واضح أي من هذين الأسلوبين أفضل عند التعميم إلى الفضاء الكيميائي الجديد. علاوة على ذلك، نادرًا ما تم فحص هذه النماذج الجديدة في بيئات البحث الصناعي مقارنة بالنماذج المستخدمة حاليًا. في هذا البحث، نقوم بتقييم النماذج بشكل شامل على 19 مجموعة بيانات عامة و16 مجموعة بيانات صناعية خاصة تغطي مجموعة متنوعة من النقاط النهائية الكيميائية. بالإضافة إلى ذلك، نقدم نموذجًا تلفيقيًّا رسوميًّا يتطابق باستمرار أو يتفوق على النماذج التي تستخدم الوصفات الجزيئية الثابتة وكذلك الهندسة العصبية الرسومية السابقة في كل من المجموعات البيانات العامة والخاصة. تشير نتائجنا التجريبية إلى أنه بينما لم يصل بعد الأساليب القائمة على هذه التمثيلات إلى مستوى قابلية إعادته التجريبية، فإن نموذجنا المقترح يقدم تحسينات كبيرة على النماذج المستخدمة حاليًا في سير العمل الصناعي.