عنوان جديد: SYNCOGEN: منصة تعلم آلي لتصميم جزيئات ثلاثية الأبعاد قابلة للتصنيع بشكل فعّال
في عالم اكتشاف الأدوية الحديث، تُعد نماذج تصميم الجزيئات الجينيراتيف (التي تُولد جزيئات جديدة) من أدوات مبتكرة توسّع مساحة الكيمياء المتاحة للباحثين، مما يسمح باستكشاف مركبات جديدة بسرعة. ومع ذلك، يظل التحدي الأكبر هو أن العديد من الجزيئات التي تُولد عبر الذكاء الاصطناعي تكون صعبة أو مستحيلة التصنيع في المختبر، مما يحد من فائدتها العملية في تطوير الأدوية والمواد الكيميائية. تُستخدم الطرق القائمة على النماذج (الـtemplate-based) مثل أشجار التصنيع المبنية على نماذج التفاعلات لحل مشكلة سهولة التصنيع، لكن هذه الطرق تركز فقط على الجزيئات في شكلها 2D، وتفتقر إلى المعلومات ثلاثية الأبعاد (3D) التي تحدد سلوك الجزيء في الأنظمة البيولوجية. لذلك، هناك حاجة ماسّة لنموذج يدمج بين الهيكل ثلاثي الأبعاد وسهولة التصنيع، مما يضمن أن الجزيئات المُولدة ليست فقط ذات شكل مناسب، بل يمكن تصنيعها باستخدام تفاعلات معروفة وعناصر بناء متوفرة. في هذا السياق، قام الباحثون من جامعة تورونتو، جامعة كامبريدج، جامعة ماكجيل، وآخرين، بتطوير إطار عمل جديد يُسمى SYNCOGEN (التصنيع المترابط)، وهو نموذج يُركز على توليد الهياكل ثلاثية الأبعاد للجزيئات مع إمكانية تصنيعها. يُعد هذا الإطار مبتكرًا لأنه يدمج بين مسارات التفاعل والهياكل الذرية أثناء التوليد، مما يضمن أن كل جزيء مُولد يمكن تصنيعه عمليًا. لتدريب SYNCOGEN، تم إنشاء مجموعة بيانات تُدعى SYNSPACE، تضم أكثر من 600,000 جزيء قابل للتصنيع، كل منها تم بناؤه من 93 عنصرًا بناءً متوفرًا تجاريًا و19 تفاعلًا موثوقًا. تم تزويدها بثلاثة ملايين وثلاثمائة ألف تكوين ثلاثي الأبعاد مُحسّن من حيث الطاقة، مما يوفر موارد تدريبية متنوعة وموثوقة. يستخدم SYNCOGEN نموذجًا مُعدّلًا من SEMLAFLOW، وهو شبكة عصبية تعتمد على التكافؤ في الفضاء ثلاثي الأبعاد (SE(3))، وتشمل بنية النموذج: تدريب على الرسوم البيانية المُعَمَّمة (masked graph diffusion) والتطابق التدريجي للإحداثيات الذرية. خلال التدريب، يتم تطبيق معايير مثل الـcross-entropy للرسوم البيانية، وخطأ المربع المتوسط للإحداثيات، بالإضافة إلى عقوبات على المسافات بين الذرات، مما يضمن صحة الكيمياء وواقعية الشكل. في اختبارات الأداء، حقق SYNCOGEN نتائج متميزة في توليد الجزيئات ثلاثية الأبعاد دون تدخل، وتفوق على النماذج الأخرى في توليد جزيئات قابلة للتصنيع. كما أظهر أداءً قويًا في مهام مثل ربط القطع (fragment linking)، حيث يمكنه توليد نسخ مماثلة من الأدوية المعقدة، مع تحسينات في نقاط التثبيت (docking scores) وسهولة التحلل العكسي (retrosynthetic tractability). تُعد SYNCOGEN خطوة مهمة نحو تصميم جزيئات مُمكنة من الناحية التجريبية، حيث تجمع بين الجوانب الهيكلية والتصنيعية، مما يقرب التصميم الحاسوبي من التطبيق العملي في المختبرات. من المتوقع أن تُستخدم في تطوير أدوية جديدة، وتصميم مواد مبتكرة، وتوسيع مكتبة التفاعلات والعناصر البنية، بالإضافة إلى تكاملها مع الروبوتات المخبرية لتسهيل التصنيع والاختبارات تلقائيًا. يُقدّر الخبراء في مجال الكيمياء الحيوية والذكاء الاصطناعي أن SYNCOGEN يمثل تقدمًا أساسيًا في مجال توليد الجزيئات، ويُعد إضافة قوية لتطوير الأدوية، حيث يوفر إمكانية تصميم جزيئات موثوقة من الناحية الكيميائية وقابلة للتصنيع، مما يفتح آفاقًا جديدة في تطوير الأدوية وعلوم المواد.