تقترح NVIDIA تقنية ReaSyn، التي تعتمد على تشبيه التركيب الجزيئي لسلسلة الأفكار لتحقيق معدل إعادة بناء وتنوع مسار مرتفع للغاية.

يكمن التحدي الأساسي لاكتشاف الأدوية الحديثة في التحديد الدقيق للجزيئات ذات الإمكانات العلاجية ضمن فضاء كيميائي يكاد يكون لانهائيًا. غالبًا ما يواجه اكتشاف الأدوية التقليدي معضلة مزدوجة: فالفضاء الكيميائي شاسع للغاية، حيث يصل عدد الجزيئات المحتملة المكونة من 10 ذرات فقط إلى 10⁶⁰، مما يجعل الفحص صعبًا كالعثور على إبرة في كومة قش. علاوة على ذلك، يجب أن تستوفي الجزيئات المرشحة متطلبات متعددة، بما في ذلك النشاط والسمية والذوبان. وينتج عن ذلك دورات تطوير تتجاوز غالبًا 10 سنوات، وتكاليف بمليارات الدولارات، ومعدل نجاح أقل من 10⁶⁰.
كانت النماذج التوليدية الجزيئية واعدة في السابق بهذا الشأن. فباستخدام خوارزميات لمحاكاة توليد البنية الجزيئية، مكّنت هذه التقنية من تقصير دورات الاكتشاف بشكل ملحوظ، بل وتمكين "التصميم حسب الطلب". ومع ذلك، وُجد عمليًا أن الجزيئات المُولّدة بالنماذج غالبًا ما يصعب تصنيعها في المختبر. وقد حدّ هذا القيد "الورقي" بشدة من قيمتها العملية.
لتجاوز هذه العقبة، جرّب المجتمع الأكاديمي استراتيجيتين: الأولى هي استخدام "قابلية التركيب" كهدف للتحسين، وتوجيه توليد جزيئات سهلة التركيب من خلال التقييم. ومع ذلك، نظرًا لتعقيد العلاقة بين البنية وقابلية التركيب وصعوبة التقييم لتغطية المتغيرات التجريبية، فإن التأثير محدود؛ والثانية هي حصر النموذج في استكشاف الجزيئات المعروفة القابلة للتركيب فقط. ورغم أن هذا يُحسّن قابلية التحكم، إلا أنه يُضعف الابتكار الهيكلي. لذلك، جذبت استراتيجية "الإسقاط القابل للتصنيع" الانتباه. ويتمثل جوهرها في "تصحيح" الجزيئات غير القابلة للتصنيع وتحويلها إلى نظائر ذات هياكل متشابهة ومسارات تصنيع واضحة.يمكن لهذه الاستراتيجية دمج طرق توليد متعددة بشكل مرن لدعم المهام مثل توسيع المركب النشط وتحسين العملاء المحتملين.
وفي هذا السياق،ReaSyn، وهو إطار عمل إسقاط جزيئي فعال وقابل للتركيب مع قدرات تفكير متكاملة، أطلقه فريق البحث في NVIDIA،من خلال اعتماد تمثيل سلسلة التفاعل (CoR) واعتبار مسار التوليف مسارًا استدلاليًا لسلسلة الفكر (CoT) في LLM، تم فتح مسار جديد لحل المشكلات العملية للتوليف الجزيئي.
في إعادة بناء الجزيئات القابلة للتصنيع،حقق ReaSyn أعلى معدل إعادة بناء وتنوع المسار؛كما حققت أفضل أداء تحسين في التحسين الجزيئي الموجه نحو الهدف القابل للتصنيع وتفوقت بشكل كبير على الطرق السابقة في مهمة توسيع الإصابة القابلة للتصنيع.
وقد تم نشر نتائج البحث ذات الصلة على arXiv تحت عنوان "إعادة التفكير في قابلية تصنيع الجزيئات باستخدام سلسلة التفاعل".
أبرز الأبحاث:
* تقترح هذه الدراسة إطار عمل ReaSyn وتمثيل سلسلة التفاعل (CoR) لتحويل المسارات الاصطناعية إلى سلاسل فكرية قابلة للتفسير من أجل التفكير.
* تعمل حلول الضبط الدقيق RL والتوسع الحسابي المخصصة على تحسين كفاءة استكشاف النموذج وأداء التحسين بشكل كبير.
* من خلال التجارب متعددة المهام، تم تأكيد فعالية وتنوع الإطار في توليد وتحسين الجزيئات القابلة للتصنيع.
عنوان الورقة:
https://arxiv.org/abs/2509.16084
قم بمتابعة الحساب الرسمي ورد "ReaSyn" للحصول على ملف PDF كامل

مزيد من أوراق البحث الرائدة في مجال الذكاء الاصطناعي:
إنشاء مجموعة بيانات قريبة من تطوير الأدوية الحقيقية
قامت الدراسة في البداية ببناء إطار تجريبي قريب من سيناريو تطوير الدواء الحقيقي، باستخدام مجموعة تفاعل تحتوي على 115 نوعًا شائعًا من التفاعلات ودمجها مع 212000 كتلة بناء قابلة للشراء تم الحصول عليها من كتالوج مخزون Enamine في الولايات المتحدة.معًا، فإنهما يحددان مساحة كيميائية اصطناعية يتجاوز حجمها 10⁶⁰ جزيء.تركز التجربة على مهمة "إعادة بناء الجزيئات القابلة للتصنيع"، بهدف اختبار قدرة النموذج على تغطية مساحة كيميائية كبيرة من خلال توليد مسارات تركيبية ممكنة لجزيئات معينة.
في تصميم مجموعة الاختبار، استخدم فريق البحث مجموعات متعددة من الجزيئات ذات التحديات المختلفة.بالإضافة إلى مجموعة اختبار أساسية مكونة من 1000 جزيء اختيرت عشوائيًا من مجموعة بيانات التنوع Enamine REAL وقاعدة بيانات ChEMBL، أُنشئت مجموعة اختبار موسعة لمحاكاة سيناريوهات "تحديثات مخزون العناصر الأساسية" في تطوير الأدوية. اختير أكثر من 37000 جزيء، تحتوي على أقل من 18 ذرة ثقيلة، من مكتبة ZINC250k، كعناصر أساسية جديدة، وتم توليد 1000 جزيء اختبار من هذا المخزون الموسَّع. كما تضمنت التجربة مجموعة اختبار ChEMBL التي اقترحها لوه وآخرون لضمان إمكانية مقارنتها بالأبحاث الحالية.
إطار عمل ReaSyn: مسار تكنولوجي تقدمي من التمثيل الجزيئي إلى تعزيز الاستدلال
يهدف إطار عمل ReaSyn إلى معالجة الاختناقات الاستدلالية الرئيسية في إسقاط الجزيئات القابلة للتصنيع.ويتبع مسارها التقني منطقًا تقدميًا بدءًا من الابتكار في التمثيل الجزيئي وصولًا إلى تعزيز قدرات التفكير.
كما هو موضح في الشكل أدناه، حددت الدراسة في البداية بوضوح الفضاء الكيميائي القابل للتركيب: يُحدد هذا الفضاء بمجموعة من وحدات البناء ومجموعة من قواعد التفاعل. يصف كل تفاعل عملية تحول المتفاعلات إلى نواتج باستخدام لغة SMARTS، بينما يمثل الفضاء القابل للتركيب مجموعة جميع النواتج التي يمكن الحصول عليها من وحدات البناء الأولية من خلال التطبيق التكراري لقواعد التفاعل. في هذا الإطار، يتمثل الهدف الأساسي من الإسقاط القابل للتركيب في توليد مسار تركيبي 𝑝 لجزيء هدف معين 𝑥 بحيث يكون التشابه الهيكلي بين الناتج النهائي للمسار و𝑥 هو أقصى ما يمكن.

الإطار العام لـ ReaSyn
من حيث تمثيل مسار التخليق الجزيئي، كما هو موضح في الشكل أدناه،اقترحت شركة ReaSyn بشكل مبتكر استراتيجية تمثيل "سلسلة التفاعل (CoR)".يتغلب هذا على القيود المتنوعة لـ"تمثيل لاحقات الشجرة التركيبية" التقليدي. فبينما تدعم الطرق التقليدية توليد الانحدار الذاتي، إلا أنها تعاني من عيوب جوهرية، مثل الحاجة إلى التعلم الضمني لقواعد التفاعل، وقابلية التنبؤات الهرمية لانتشار الأخطاء، وغياب التطابقية في تمثيلات بصمات الكتل البنائية.
لقد حققت طريقة تمثيل سلسلة التفاعل ثلاثة إنجازات مهمة مع الحفاظ على تنوعها: دمج سلسلة الأفكار (CoT) على مستوى التفاعل الكيميائي، وتحقيق التنبؤ الكامل بالمسار دون تصنيف هرمي، والقضاء على الاعتماد على البصمات الجزيئية.
في تطبيق محدد، يُقسّم مسار التركيب إلى كتل وظيفية متعددة، تشترك جميعها في مفردات موحدة. تُمثَّل الكتل الجزيئية بسلاسل SMILES ذات علامات خاصة، بينما تُمثَّل كتل التفاعل برموز مفردة. وأخيرًا، يُشكَّل تسلسل مسار كامل من خلال عمليات الربط.

يعتمد التدريب النموذجي على استراتيجية من مرحلتين تجمع بين التعلم الخاضع للإشراف والتعلم المعزز.
في مرحلة التعلم الخاضع للإشراف، يتم استخدام البيانات المزدوجة للجزيئات المستهدفة والمسارات الاصطناعية لتدريب نموذج المحول بهدف التنبؤ بالرمز التالي.ومن خلال تصميم دالة خسارة مرجحة لنوع الرمز لموازنة كثافة التعلم لأنواع مختلفة من الرموز، مع توفير إشارات إشراف أكثر ثراءً بمساعدة المنتجات الوسيطة.يتم استخدام خوارزمية التعلم المعزز عبر الإنترنت في مرحلة ضبط التعلم المعزز.تُستخدم آلية المكافأة لتوجيه النموذج لاستكشاف مسارات أكثر فعالية. ولا تقتصر دالة الخسارة الخاصة بها على تعظيم مكافآت المسارات، بل تُركز أيضًا على استقرار سلوك النموذج، مما يُعوّض بفعالية عن قيود التعلم المُشرف في قدرات الاستكشاف.
في مرحلة الاستدلال،يجمع ReaSyn بين بنية مكدسة وآلية بحث شعاعية لتحقيق توسع حوسبة موجه نحو الهدف في وقت الاختبار وتخصيص استراتيجيات التقييم بناءً على متطلبات المهام المختلفة. يدير المكدس المتفاعلات والوسيطات ديناميكيًا، مما يدعم عملية التفكير التدريجي؛ ويحافظ بحث الشعاعي على تنوع البحث من خلال الحفاظ على مسارات مرشحة متعددة ذات درجات عالية.
في مهمة إعادة البناء الجزيئي،تركز استراتيجية التسجيل على التشابه البنيوي وإمكانية التفاعل لضمان إعادة إنتاج دقيقة للجزيء المستهدف؛ في مهام التحسين الجزيئي وتوسيع النشاط، يتم تقديم نموذج مكافأة لتقييم خصائص الهدف من كتل البناء والوسائط، وتوجيه البحث نحو الجزيئات القابلة للتصنيع ذات الخصائص المثالية، وتحقيق الاستكشاف المستهدف والتحسين داخل المساحة القابلة للتصنيع.
النتائج التجريبية: أداء المهام المتعددة يتفوق على SynNet والطرق الأخرى، وتؤكد تجارب الاستئصال فعالية المكونات الأساسية
وتظهر النتائج التجريبية في الجدول التالي.يُظهر ReaSyn أداءً شاملاً متفوقًا على طرق SynNet وSynFormer الحالية في العديد من المهام الرئيسية.

في مهمة تحسين جزيئات الهدف القابلة للتصنيع،ركز البحث على كيفية قدرة ReaSyn على تحسين جدوى طرق التحسين التقليدية.تستخدم هذه المهمة خوارزمية الرسم البياني الجينية (Graph GA) كإطار عمل أساسي، وتُدخل ReaSyn بعد مرحلة التكاثر لإجراء معالجة إسقاطية قابلة للتركيب لضمان وجود جميع الجزيئات الناتجة في الفضاء القابل للتركيب. تُسمى هذه الطريقة Graph GA-ReaSyn.
تنقسم التجربة إلى قسمين: الأول هو تحسين الخاصية العامة بناءً على دالة أوراكل TDC، والآخر هو التحسين المستهدف لتقارب الارتباط لهيدرولاز الإيبوكسيد القابل للذوبان (sEH).
في مهمة TDC،كما هو موضح في الجدول أدناه، تفوقت Graph GA-ReaSyn على جميع طرق خط الأساس الاصطناعية القائمة على القيود في مقياس "أفضل 10 طرق AUC" عبر 15 مهمة تحسين، وكانت درجة إمكانية الوصول الاصطناعية (درجة SA) الخاصة بها أفضل بكثير من Graph GA الأصلي، مما يشير إلى أن ReaSyn حسّنت قابلية التركيب بشكل فعال مع الحفاظ على أداء التحسين. في تحسين تقارب sEH، تفوقت ReaSyn على طرق مثل FragGFN وSynFlowNet وSyntheMol من حيث تقارب الارتباط، ودرجة SA، وتشابه الدواء (QED).وعلى وجه الخصوص، يتم تسليط الضوء على مزاياها في تحقيق التوازن بين خصائص الهدف وإمكانية التوليف.

في مهمة توسيع نطاق المركبات النشطة الاصطناعية،يستخدم ReaSyn البحث الشعاعي لتوليد العديد من النظائر المتشابهة هيكليًا والقابلة للتصنيع للمركبات النشطة المعروفة، وذلك لتوسيع مكتبة الجزيئات المرشحة. اعتمدت التجربة على مثبطات JNK3 كهدف بحثي، حيث تم اختيار أفضل عشرة جزيئات من قاعدة بيانات ZINC250k كنقطة انطلاق، وتم توليد 100 نظير لكل جزيء.تم تقييم ReaSyn من خلال ثلاثة مؤشرات وهي "المعدل التناظري" و"معدل التحسن" و"معدل النجاح"، وتفوقت ReaSyn على الطرق السابقة في جميع المؤشرات.
يعزز التنبؤ بالمسارات الاصطناعية المعتمدة على الذكاء الاصطناعي الابتكار في تصميم الجزيئات القابلة للتصنيع
في حين تتطور تقنيات التنبؤ بمسارات التخليق المعتمدة على الذكاء الاصطناعي مثل ReaSyn، فإن الأوساط الأكاديمية العالمية ومجتمعات الأعمال تستكشف أيضًا هذا المجال بنشاط، مما يدفع الابتكار في تصميم الجزيئات القابلة للتصنيع من مسارات مختلفة.
غالبًا ما يركز البحث الأكاديمي على الإنجازات في الأساليب والآليات الأساسية الجديدة. على سبيل المثال،أورجانا، وهو نظام روبوتي مكتبي طورته جامعة تورنتو،من خلال الجمع بين الرؤية الحاسوبية ونموذج اللغة الكبير (LLM)، من الممكن تحويل تعليمات اللغة الطبيعية إلى كود χDL للغة الوصف الكيميائي القياسية، وأتمتة بعض مهام المختبر الكيميائي، وبالتالي تحويل التعليمات اللفظية للعلماء إلى عمليات تجريبية.
كيميائي روبوتي متنقل، وهو كيميائي ذكاء اصطناعي تم تطويره بشكل مستقل من قبل جامعة ليفربول،تم إنجاز 688 تجربة في 8 أيام، وتمت دراسة 1000 صيغة محفزة في أسبوع، وتم اكتشاف محفز جديد.
يركز الابتكار في عالم الأعمال بشكل أكبر على تحويل التقنيات المتقدمة إلى إنتاجية فعلية ودمجها في سير العمل الحالي.إن التعاون الاستراتيجي بين BenevolentAI، وهي شركة بريطانية متخصصة في البحث والتطوير في مجال الأدوية المعتمدة على الذكاء الاصطناعي، وشركة Merck هو تعاون نموذجي للغاية.يعتمد الأول على أدوات التصميم الكيميائي لمنصته المتكاملة للذكاء الاصطناعي، إلى جانب مرافق مختبرات الأبحاث الرطبة في كامبريدج، المملكة المتحدة، لتزويد خط أنابيب أبحاث وتطوير الأدوية التابع لشركة ميرك بدعم شامل، بدءًا من تحديد المركب النشط ووصولًا إلى تطوير الجزيئات المرشحة قبل السريرية. يكمن جوهر هذا النهج في الاستفادة من قدرات استدلال المسارات التركيبية لنماذج اللغات الكبيرة، لضمان أن تتمتع المركبات الجزيئية الصغيرة المُولّدة بنشاط عالٍ وقابلية للتركيب، مما يُقلل بشكل كبير من دورة التحويل من المفهوم إلى الجزيئات المرشحة.
أثبتت شركة Insilico Medicine، وهي شركة تكنولوجيا حيوية تعتمد على الذكاء الاصطناعي، القيمة العملية لتصميم إمكانية الوصول الاصطناعي في تطوير الأدوية من البداية إلى النهاية. يستخدم دواءها المرشح لعلاج التليف الرئوي مجهول السبب INS018_055، المصمم باستخدام الذكاء الاصطناعي التوليدي، وحدة إسقاط مدمجة قابلة للتركيب تشبه ReaSyn.حقق معدل نجاح بنسبة 100٪ في تصنيع TP3T في الدراسات السريرية المسبقة،علاوة على ذلك، يستغرق الأمر 18 شهرًا فقط من اكتشاف الهدف إلى تحديد الجزيء المرشح، وهو أقصر بمقدار 60% من المتوسط الصناعي.
تشير هذه الاستكشافات المتنوعة من الأوساط الأكاديمية والصناعية، على الرغم من نقاط الدخول والمسارات التقنية المختلفة، إلى هدف واحد: تحسين قدرتنا وكفاءتنا في تصميم وتوليف الجزيئات المفيدة من خلال أساليب مبتكرة، وفي نهاية المطاف حقن زخم جديد في العديد من المجالات مثل البحث والتطوير الدوائي وتطوير المواد الجديدة.
روابط مرجعية:
1.https://mp.weixin.qq.com/s/Mz64afMOOI_7m-Nqg_m5oQ
2.https://mp.weixin.qq.com/s/1Juv9z1-mUOR6Sip4KwvgQ
3.https://mp.weixin.qq.com/s/vhhb2OUtCRpbPLg8j4YsYQ