HyperAI

بمقارنة 11 خوارزمية أفقيًا، أطلقت جامعة تورنتو نموذجًا للتعلم الآلي لتسريع تطوير أدوية جديدة قابلة للحقن طويلة المفعول

特色图像

وبحسب "تقرير عن حالة التغذية والأمراض المزمنة لدى المقيمين الصينيين (2020)"، ففي عام 2019، شكلت الوفيات الناجمة عن الأمراض المزمنة 88.51% من إجمالي الوفيات في بلدي.أصبحت الأمراض المزمنة "قاتلاً" خطيراً يهدد صحة الإنسان.خذ على سبيل المثال مرض الفصام، وهو مرض مزمن يصفه العلماء بأنه "أسوأ مرض يصيب البشرية". إذا أراد المرضى التعافي بشكل كامل، فإنهم يحتاجون إلى فترة طويلة من العلاج الصيانة. ومع ذلك، خلال هذه الفترة، قد يتوقف المرضى عن تناول الدواء لأسباب مختلفة، مما يؤدي إلى الانتكاس.

من أجل حل مشكلة عدم الالتزام بتناول الأدوية بين المرضى المزمنين، ظهرت الحقن طويلة المفعول. يتم تصنيع هذا الدواء عن طريق إذابة جرعة كافية من الدواء في مستحضر معين، والذي يدخل الجسم عن طريق الحقن لتشكيل "مستودع تخزين" صغير للدواء، ثم يتم إطلاق الدواء ببطء في الجسم لممارسة تأثير علاجي مستقر. بالمقارنة مع الأدوية التقليدية،تتمتع الحقن طويلة المفعول بمزايا فترات الجرعات الطويلة، والعمل السريع، وجرعة الدواء المستقرة.

ومن ناحية أخرى، فإن البحث والتطوير لهذا النوع الجديد من الأدوية يشكلان تحديًا كبيرًا أيضًا. على سبيل المثال، من أجل تحقيق الإطلاق الأمثل للدواء في الجسم ضمن إطار زمني محدد، هناك حاجة إلى عدد كبير من التجارب المكثفة على مجموعة متنوعة من التركيبات المرشحة. إن هذه العملية مرهقة وتستغرق وقتا طويلا، مما يشكل عقبة أمام المزيد من تطوير الحقن طويلة المفعول.

في الآونة الأخيرة، قام باحثون من جامعة تورنتو بتطوير نموذج التعلم الآلي. وتظهر النتائج التجريبية ذات الصلة أن النموذج يمكنه التنبؤ بدقة بمعدل إطلاق الأدوية القابلة للحقن طويلة المفعول، مما يعمل بشكل فعال على تسريع تطوير الأدوية القابلة للحقن طويلة المفعول.وتم نشر البحث في مجلة Nature Communications.عنوان البحث هو "نماذج التعلم الآلي لتسريع تصميم الحقن البوليمرية طويلة المفعول".

وقد نشرت النتائج في مجلة Nature Communications.

عنوان الورقة:

https://www.nature.com/articles/s41467-022-35343-w#Abs1

 نظرة عامة على التجربة

تأتي المستحضرات القابلة للحقن طويلة المفعول في مجموعة متنوعة من الأنواع، وعادة ما تكون عبارة عن دهون وبوليمرات صناعية.يوضح الشكل أدناه مقارنة بين النهج التقليدي والنهج القائم على البيانات لتطوير تركيبات الحقن طويلة المفعول.

الشكل 1: مخطط تخطيطي لأساليب البحث والتطوير التقليدية والقائمة على البيانات للمستحضرات القابلة للحقن طويلة المفعول

أ- الشكل: طرق إعطاء تركيبات الحقن طويلة المفعول المعتمدة من قبل إدارة الغذاء والدواء الأمريكية.

الشكل ب: دورة المحاولة والخطأ النموذجية في تطوير تركيبات الحقن التقليدية طويلة المفعول.

الشكل ج: نظرة عامة على سير العمل في هذه الدراسة، التي تستخدم نماذج التعلم الآلي المدربة لتسريع عملية تطوير تركيبات الحقن طويلة المفعول.

تم إنشاء مجموعة البيانات التجريبية هذه من نتائج الأبحاث المنشورة سابقًا.تتم أيضًا إضافة البيانات من المصادر الخارجية التي تم البحث فيها باستخدام محرك Web of Science. على وجه التحديد، تتضمن مجموعة البيانات كميات الإطلاق (عدد جزيئات الدواء التي تم إطلاقها في وقت معين) لـ 181 دواءً و43 تركيبة من الأدوية والبوليمرات. وفي الوقت نفسه، قام الباحثون بتقسيم مجموعة البيانات التي تم إنشاؤها إلى مجموعتين فرعيتين:يتم استخدامها للتدريب النموذجي واختباره على التوالي.

مجموعة بيانات الحقن طويلة المفعول

وكالة النشر:جامعة تورنتو

الكمية المتضمنة:إطلاق 181 دواءً و43 تركيبة دوائية بوليمرية

الحجم المقدر:394.1 كيلوبايت

وقت الإصدار:2022

عنوان التنزيل:hyper.ai/datasets/23625

الإجراءات التجريبية

في هذه الدراسة، قام الباحثون بتدريب ما مجموعه 11 خوارزمية للتعلم الآلي.بما في ذلك الانحدار الخطي المتعدد (MLR)، وأقل انكماش مطلق ومشغل الاختيار (Lasso)، والانحدار الجزئي لأقل المربعات (PLS)، وشجرة القرار (DT)، والغابة العشوائية (RF)، وآلة تعزيز التدرج الخفيف (LGBM)، وتعزيز التدرج الشديد (XGB)، وتعزيز التدرج الطبيعي (NGB)، وانحدار متجه الدعم (SVR)، وخوارزمية أقرب جار (k-NN) والشبكة العصبية (NN).

اختيار النموذج 

لتقييم الأداء التنبئي لهذه نماذج التعلم الآلي، استخدم الباحثون نهج التحقق المتبادل المتداخل الذي يتكون من حلقة داخلية (التدريب والتحقق) وحلقة خارجية (الاختبار). وتتمثل العملية المحددة في أن الباحثين قاموا أولاً بتجميع مجموعة البيانات وفقًا لتركيبة الدواء والبوليمر.وبعد ذلك، تم إجراء 10 تجارب تحقق متداخلة على كل نموذج من نماذج التعلم الآلي.

أخيرًا، تم تلخيص أداء التنبؤ لكل نموذج تعلُّم آلي في حلقات التحقق المتبادل المتداخلة الداخلية والخارجية في الجدول 1 والشكل 2 أدناه. يوضح الجدول 1 قيم متوسط الخطأ المطلق (MAE) ومتوسط الخطأ المعياري (σM، الموضح بين قوسين) التي تم الحصول عليها بعد التنبؤ بإطلاق الدواء باستخدام خوارزميات التعلم الآلي المختلفة في التحقق المتبادل المتداخل (n = 10). كما يمكن أن نرى من الجدول،تعتبر نماذج الآلات المستندة إلى الشجرة أكثر دقة بشكل عام من النماذج الخطية والنماذج المستندة إلى المثيلات ونماذج التعلم العميق (MAE < 0.16).

الجدول 1: أداء التنبؤ لكل نموذج تعلُّم آلي في التحقق المتبادل المتداخل

يوضح الشكل 2 قيم الخطأ المطلق (AE) لتوقعات إطلاق الدواء التي تم الحصول عليها في التحقق المتبادل المتداخل (n=10). بدمج المعلومات الواردة في الجدول 1 والشكل 1، فإن النموذج القائم على LGBM لديه أصغر قيمة MAE وقيمة AE في كل من الحلقات الداخلية والخارجية بين النماذج الـ 11. لذلك،ويعتقد الباحثون أن النموذج المبني على LGBM هو النموذج الذي يتمتع بأفضل أداء تنبؤي.

الشكل 2: الأداء العام للتنبؤ لكل نموذج خوارزمية

تمثل الدوائر السوداء والخطوط السوداء المتقطعة في المربعات الموجودة في الشكل قيمة MAE وقيمة AE لكل نموذج على التوالي.

تحسين النموذج 

من أجل تحسين قدرة التعميم لنماذج التعلم الآلي بشكل أكبر،كما قام الباحثون بتحسين نموذج LGBM بـ 17 ميزة من خلال تحليل المجموعة.

هنا استخدموا خوارزمية التجميع الجار الأبعد، كما هو موضح في الشكل أدناه، لترتيب ميزات الإدخال في التسلسل الهرمي. ووجد الباحثون تكرارًا في 17 ميزة. بعد التحسينات،أخيروقد تم تحديد أن نموذج LGBM الذي يحتوي على 15 ميزة حقق أفضل أداء.

الشكل 3: خريطة حرارية لمعامل ارتباط سبيرمان لخصائص الإدخال الأولية السبعة عشر

يشير اللون الأزرق الداكن إلى معامل ارتباط سبيرمان المطلق (طريقة لدراسة الارتباط بين متغيرين بناءً على بيانات الرتبة) وهو 1، ويشير اللون الوردي إلى معامل ارتباط سبيرمان المطلق وهو 0. يرافق خريطة الحرارة مخطط شجري يوضح التسلسل الهرمي لمجموعات الميزات التي تم تحديدها من خلال تحليل المجموعات الهرمية التراكمية.

النتائج التجريبية 

بعد الحصول على النموذج الأمثل أعلاه، أجرى الباحثون اختبارين. كان الهدف الأول هو استخدام النموذج للتنبؤ بمنحنى إطلاق الدواء لدواء حقن طويل المفعول معين، وكان الهدف الثاني هو استخدام النموذج للتنبؤ بمنحنى إطلاق الدواء لبوليمر الدواء في مجموعة الاختبار. وتمت مقارنة النتائج مع منحنيات إطلاق الدواء التجريبية، وتظهر النتائج في الشكل أدناه.

يوضح الشكل 4 مقارنة بين ملفات تعريف إطلاق الدواء المتوقعة والتجريبية لحقنة طويلة المفعول مختارة، ويوضح الشكل 5 مقارنة بين ملفات تعريف إطلاق الدواء لبوليمر الدواء وملفات تعريف إطلاق الدواء التجريبي. ويمكن ملاحظة أنه في كلتا الحالتين،القيم المتوقعة والقيم التجريبية متسقة بشكل أساسي.لذلك، يعتقد الباحثون أن النموذج القائم على خوارزمية LGBM يمكنه التنبؤ بدقة بمعدل إطلاق الدواء للحقن طويلة المفعول.

الشكل 4: مقارنة بين منحنيات إطلاق الدواء المتوقعة والتجريبية للحقن طويلة المفعول في مجموعة البيانات

الشكل 5: مقارنة بين أنماط إطلاق الدواء البوليمري المتوقعة والنماذج التجريبية المقابلة

تحالف التسريع: المساعدة في تنفيذ نماذج البحث العلمي الجديدة

ومن الجدير بالذكر أنينتمي مؤلفا هذا البحث، كريستين ألين وألان أسبورو-جوزيك، إلى اتحاد التسريع (AC).تأسست منظمة Accelerator Alliance في عام 2021، وهي عبارة عن تعاون عالمي جديد بين الأوساط الأكاديمية والصناعة والحكومة، ومقرها في جامعة تورنتو بكندا، بهدف استخدام الذكاء الاصطناعي والروبوتات لتسريع اكتشاف وتصميم المواد والجزيئات الجديدة.

"هدفنا هو تسريع العلوم"وقال آلان أسبورو جوزيك، مدير تحالف Accelerator Alliance: "لتحقيق هذا الهدف، أدركنا أنه يمكننا توسيع نطاق التفكير وراء القيادة الذاتية ليشمل المختبرات الآلية، باستخدام الذكاء الاصطناعي والأتمتة للتجربة بطرق أكثر ذكاءً".

الشكل 6: تحالف المسرعات، حيث يقوم أحد العلماء بإخراج الكواشف الموزعة مسبقًا من روبوت توزيع المواد الصلبة الآلي

ومن الجدير بالذكر أنه في الشهر الماضي فقط، حصل تحالف المسرعات على منحة قدرها 200 مليون دولار أمريكي من صندوق التميز البحثي الأول في كندا (CFREF)، والتي سيتم استخدامها لدعم عمل التحالف في مجال "مختبرات القيادة الذاتية". وقال ميريك جيرتلر، رئيس جامعة تورنتو:"إن هذه الاستثمارات الكبيرة في البحث والابتكار القائم على الذكاء الاصطناعي لديها القدرة على تحسين حياة الناس في كندا وحول العالم.".

عنوان الكود لهذه الدراسة:

https://github.com/aspuru-guzik-group/long-acting-injectables