HyperAI

لاستكشاف المكونات النشطة للأدوية الطبيعية بشكل كامل، قام فريق البروفيسور ليو شاو من جامعة سنترال ساوث ببناء منصة IMN4NPD

特色图像


في عام 1806، تمكن الصيدلي الألماني سيرتورنر البالغ من العمر 23 عامًا من عزل مركب المورفين من نبات الخشخاش لأول مرة، مما يمثل بداية لأبحاث الكيمياء الدوائية الطبيعية الحديثة. وعلى هذا الأساس، نجح الكيميائي الألماني فريدريش وولر في عام 1828 في تحقيق التركيب الاصطناعي لليوريا، وهو ما يمثل أيضًا الميلاد الرسمي لعلم الكيمياء العضوية. يمكن القول أن أبحاث البشرية المستمرة حول المنتجات الطبيعية النشطة بيولوجيًا هي التي أدت إلى إنشاء علم الكيمياء العضوية.

إن ما يسمى بالمنتجات الطبيعية النشطة بيولوجيًا (NPs) هي في الواقع كيانات مادية تطورت على مدى فترة طويلة من الزمن في الطبيعة وهي مصدر مهم للبحث والتطوير للمواد النشطة بيولوجيًا والأدوية العملية. في عملية تطوير الأدوية، قدمت الجسيمات النانوية مساهمات كبيرة في ابتكار الأدوية العلاجية للسرطان والأمراض المعدية. ومع ذلك، لا تزال الجسيمات النانوية تواجه حتى الآن حواجز تقنية في الفحص والفصل والتشخيص والتحسين. ومن بين هذه التحديات، يعد فصل الجسيمات النانوية عن الخلائط المعقدة أحد التحديات الأكثر خطورة، والذي أصبح أيضًا بمثابة عنق زجاجة رئيسي في أبحاث الأدوية.

ولمعالجة هذا الاختناق،  نجح فريق البروفيسور ليو شاو من قسم الصيدلة بمستشفى شيانغيا بجامعة سنترال ساوث في إنشاء سير عمل شبكي جزيئي متكامل لإزالة تكرار NP (IMN4NPD) والذي يمكنه استكشاف المكونات الدوائية للأدوية الطبيعية بشكل شامل.فهو لا يعمل فقط على تسريع عملية إلغاء التكرار للمجموعات الواسعة في الشبكات الجزيئية، بل يوفر أيضًا تعليقات توضيحية للحلقات الذاتية والعقد المزدوجة التي غالبًا ما يتم تجاهلها في طرق البحث الحالية. وقد نُشرت نتائج الأبحاث ذات الصلة مؤخرًا في مجلة Analytical Chemistry، وهي مجلة تابعة للجمعية الكيميائية الأمريكية (ACS).

عنوان الورقة:
https://doi.org/10.1021/acs.analchem.3c04746
قم بمتابعة الحساب الرسمي ورد "الطب الطبيعي" للحصول على ملف PDF كامل

IMN4NPD: دمج أدوات حسابية متعددة لتشغيل الشبكات الجزيئية القائمة على التشابه الطيفي

المبدأ الأساسي لعمل IMN4NPD هو الشبكات الجزيئية التي يقودها التشابه الطيفي.يساعد الباحثين على التعرف بسرعة على فئات محددة من المركبات من خلال دمج وتنسيق أدوات حسابية متعددة مثل NPClassifier وmolDiscovery وشبكات t-SNE، مع تبسيط شرح عقد الشبكة الجزيئية أيضًا.
* NPClassifier: أداة تصنيف بنية المنتج الطبيعي تعتمد على الشبكات العصبية العميقة
* molDiscovery: طريقة البحث في قاعدة بيانات مطياف الكتلة

بشكل عام، يمكن تقسيم سير عمل IMN4NPD إلى 3 خطوات:

الخطوة الأولىتمت معالجة بيانات LC-MS الخام مسبقًا لتوليد شبكات جزيئية أو شبكات جزيئية تعتمد على الميزات. بعد ذلك، تقوم SIRIUS، وهي أداة تصنيف NP تعتمد على الشبكات العصبية العميقة، بتصنيف الفئات المركبة بشكل منهجي من خلال NPClassifier.

الخطوة 2:أجرت هذه الدراسة تجارب إلغاء التكرار استنادًا إلى قواعد بيانات الطيف MS/MS من خلال GNPS (الشبكات الجزيئية الاجتماعية للمنتجات الطبيعية العالمية)، ثم أجرت إلغاء التكرار استنادًا إلى قاعدة بيانات الكمبيوتر من خلال molDiscovery.

الخطوة 3.استخدم الباحثون تشابه السمات الطيفية MS/MS لتوليد شبكة t-SNE وقاموا بتصنيف المركبات كيميائيًا في كل عقدة لتحديد وتكرار فئات المركبات المحددة الموزعة في الشبكة ذاتية التداول بدقة.

مخطط سير عمل IMN4NPD

تقييم قابلية الاستخدام: استكشاف نظائر الأيزوكينولين لتحديد مجموعات المركبات المحددة بسرعة في الشبكات الجزيئية

لتقييم أداء ومزايا سير عمل IMN4NPD، تمت إعادة تحليل المستخلص الإيثانولي من لب بذور اللوتس في هذه الدراسة. لب بذرة اللوتس هو الجزء الجنيني من جراب اللوتس. إنه نبات طبي صيني تقليدي غني بالقلويدات المختلفة مثل ديبنزيل إيزوكينولين ومونوبنزيلي إيزوكينولين وأبورفين. يمكن استخدامه لعلاج الأرق، وتسرب الحيوانات المنوية، واضطرابات معدل ضربات القلب، وارتفاع ضغط الدم، وأعراض أخرى.

استنادًا إلى قاعدة بيانات طيفية تجريبية MS/MS، قامت هذه الدراسة في البداية بتصنيف العقد الفردية كيميائيًا في الشبكة الجزيئية، وبالتالي التعرف بسرعة على مجموعات مركبات محددة في الشبكة الجزيئية لاستكشاف نظائر إيزوكينولين الجديدة. بعد مراجعة نتائج التصنيف الكيميائي لكل خريطة مميزة في الشبكة الجزيئية، وجد الباحثون أنه من السهل العثور على مجموعات مركبات معينة تتوافق مع نظائر الأيزوكينولين. وفي الوقت نفسه، تم توزيع مركبات الأيزوكينولين بشكل رئيسي في أربع مجموعات في الشبكة الجزيئية.

خريطة توزيع مركبات الأيزوكينولين

ووجدت الدراسة أيضًا أنه لا يمكن إعادة إنتاج سوى عدد محدود من الميزات في مجموعات كبيرة بنجاح باستخدام قواعد بيانات الطيف MS/MS التجريبية مثل قاعدة بيانات GNPS. لذلك،استخدمت هذه الدراسة خوارزمية molDiscovery المتطورة لمطابقة قواعد البيانات البنيوية.يعمل هذا النهج لإزالة التكرار الذي يعتمد على قواعد بيانات الطيف MS/MS التجريبية والمحاكاة الحاسوبية على تعزيز القدرة على شرح الهياكل المادية في الشبكات الجزيئية، وخاصة في المجموعات الكبيرة، بطريقة مناسبة وفي الوقت المناسب.

إذا أخذنا المجموعة A في قلويدات أحادي بنزيلي إيزوكينولين كمثال، فإن المجموعة تتكون من 36 عقدة، منها 7 عقد فقط موضحة في قاعدة بيانات MS، و35 عقدة موضحة في قاعدة بيانات Structure، و8 عقد موضحة بواسطة كل من قواعد بيانات MS وStructure. ومن الجدير بالذكر أن هناك عقدة عند م/ز 344.1855 (تر=7.6329) تم شرحه بالكامل بواسطة قاعدة بيانات بنية MS، والتي أشارت إلى أن البنية المرشحة كانت 3'-O-methyl-4'-methoxy-N-methylcoclaurine (كما هو موضح أعلاه).

من خلال مزيد من التحليل، فقدت العقدة NH3CH3. CH3OH و H2O، متبوعًا بتجزئة الحلقة، وتجزئة α، وتجزئة β، مما ينتج أيونات شظايا عند m/z 107.0496، 137.0597، 151.0757، 175.0750، 205.1098، 235.0752، 267.1017، 299.1271، و312.1590، على التوالي.

تم التعرف عليه من خلال قاعدة بيانات الهيكل، م/ز 448.1963 (تر = 1.6287) هو N-ميثيل نوركوكلورين 7-O-جلوكوزيد. آخر م/ز 312.1593 (تر = 7.3621) تُظهر العقدة أربعة هياكل مرشحة بما في ذلك مونوبنزيليزوكينولين واحد. و م/ز 344.1855 عقدة (تر=7.6329) مقارنة بالعقدة عند م/ز 190.0862 (ج11ح12لا2) يشير إلى أن هذه مجموعة ميثيلين ديوكسي.

نتائج البحث: بناءً على الشبكات العصبية العميقة، تم مقارنة خوارزميات البحث الثلاثة من منظور شبكات t-SNE

بالمقارنة مع MolNetEnhancer،يستخدم IMN4NPD NPClassifier، وهي أداة تصنيف NP تعتمد على الشبكة العصبية العميقة، لتصنيف كل ميزة في الشبكة الجزيئية بشكل فردي.بدلاً من مجموعات كاملة أو عائلات من الجزيئات. استخدمت هذه الدراسة تشابه جيب التمام المحسن لحساب مصفوفة التشابه واستخدمتها لإنشاء شبكة t-SNE. وفي الوقت نفسه، قامت هذه الدراسة أيضًا بتصنيف كل عقدة بناءً على بياناتها الطيفية MS/MS من خلال NPClassifier ورسمت هذه التصنيفات في شبكة t-SNE.

في وجهة النظر التقليدية للشبكة الجزيئية، يتكون الأيزوكينولين عمومًا من ثلاث مجموعات كبيرة (مجموعات AC) ومجموعة صغيرة واحدة (المجموعة D). من منظور شبكة t-SNE، من الواضح أن عقد المجموعة الأربع من الأيزوكينولين مجمعة بإحكام لتشكيل مناطق مجموعة مختلفة. ولكن تجدر الإشارة إلى أنه من منظور شبكة t-SNE، يمكن تقسيم المجموعة A في الشبكة الجزيئية إلى مجموعتين أصغر. أيضًا،يمكن لـ t-SNE تحديد عقد الأيزوكينولين بشكل فعال، وبالتالي تقليل عمل التحليل البنيوي للعقد ذات الصلة بشكل كبير.

أربع مناطق عنقودية من الأيزوكينولين في خريطة t-SNE

تحتوي طريقة تشابه جيب التمام المعدل على قيود عند التعامل مع أطياف المركبات ذات التعديلات الكيميائية المختلفة. كما اختارت هذه الدراسة أيضًا خوارزميات التشابه مثل Spec2Vec و MS2DeepScore واستخدمتها لإنشاء شبكة t-SNE. وبناءً على Spec2Vec، لا يزال الإيزوكينولين يشكل أربع مجموعات رئيسية في الشبكة الجزيئية.

ومع ذلك، استنادًا إلى MS2DeepScore، فإن عقد المجموعات الكبيرة A وB من الأيزوكينولين متقاربة، مما يشكل العديد من مناطق التجميع، ولكن العقد في المجموعة الكبيرة C متناثرة في جميع أنحاء الرسم البياني، مما يشكل تحديًا للتحليل اللاحق.

مقارنة الرسوم البيانية t-SNE التي تم إنشاؤها بواسطة خوارزميات التشابه الطيفي المختلفة

الظاهرة المثيرة للاهتمام هي أن عقدة m/z 296.1646 (tر = 11.54) في مخططات t-SNE لتشابه جيب التمام المصحح وتشابه MS2DeepScore، فهي بعيدة كل البعد عن منطقة التجمع للعقد المرتبطة بالإيزوكينولين، ولكن في مخطط t-SNE المستند إلى التشابه الطيفي Spec2Vec، تكون العقدة مجاورة لمنطقة التجمع للمجموعة الكبيرة A. قد يمثل هذا النوع من عقد التبادل الذاتي فئة من مركبات الإيزوكينولين، وأكدت المقارنة الإضافية أن العقدة عبارة عن قلويد أبورفين.

لذلك،يمكن أن يوفر التصنيف الكيميائي للمركبات وشبكة t-SNE معلومات مختلفة حول الميزات، على التوالي، مما يقلل من حدوث النتائج السلبية الكاذبة إلى حد ما.

بالإضافة إلى ذلك، استنادًا إلى شبكة t-SNE للتشابه الطيفي Spec2Vec، هناك m/z 298.1438 (tر = 7.02) و م/ز 298.1438 (تر = 7.60) عقدتين، وهما عقدة التبادل الذاتي وعقدة الزوج في الشبكة الجزيئية. على الرغم من عدم تصنيفها كمركبات إيزوكينولين، إلا أنها تشبه هيكليًا مجموعة إيزوكينولين أ. كشف التحليل الإضافي أن m/z 298.1438 (tر = 7.02) هو قلويد أبورفين معروف، نورنوسيفيريدين، م/ز 298.1438 (تر = 7.60) أظهرت أيضًا قلويدات الأبورفين المشابهة للنوسيفيرين والنورنوسيفيريدين.

ومن خلال دراسة العقد الثلاث أعلاه، وجد أنها جميعها تنتمي إلى قلويدات الأبورفين، والتي تختلف عن قلويدات مونوبنزيليسوكينولين. عند استخدام تشابه جيب التمام المعدل وتشابه MS2DeepScore، تكون هذه العقد الثلاث بعيدة عن المجموعة A، وهي منطقة تجميع العقد المرتبطة بقلويدات أحادي بنزي إيزوكينولين، ولكن بناءً على Spec2Vec، يمكن العثور على هذه العقد الثلاث بالقرب من المجموعة A.

يوضح هذا الاختلاف القدرة الفائقة للتشابه الطيفي لـ Spec2Vec في التقاط الهياكل المماثلة لمركبات الأيزوكينولين بدقة.

يتسارع تطبيق الذكاء الاصطناعي في أبحاث المنتجات الطبيعية

في السنوات الأخيرة، وبفضل التطور السريع لمختلف التقنيات الحديثة، ظهرت مجموعة كبيرة من الاستراتيجيات والأساليب الجديدة القائمة على تقنيات LC-MS/MS وNMR في مجال أبحاث الجزيئات الحيوية الطبيعية، ودمج الوسائل التقنية متعددة التخصصات مثل المعلوماتية الحيوية، وعلم الأيض، وعلوم الكمبيوتر. وعلى وجه الخصوص، مع البدء في دمج الذكاء الاصطناعي وخوارزميات التعلم الآلي في أبحاث المنتجات الطبيعية، فقد أدى ذلك إلى جلب جولة جديدة من ثورة الإنتاجية للباحثين.

في البداية، ركز تطبيق الذكاء الاصطناعي على رقمنة الجزيئات العضوية ورسم خرائط الفضاء الكيميائي للجسيمات النانوية باستخدام تقنيات تقليل الأبعاد. وفي وقت لاحق، قام الباحثون بتطوير مصنفات ثنائية للتعلم الآلي للتنبؤ بالوظائف البيولوجية للجسيمات النانوية. اليوم، بدأ استخدام هياكل الشبكات العصبية في استخراج الجينوم والتصميم الجزيئي، وأصبحت خوارزميات التعلم العميق تحظى بشعبية متزايدة في مجالات اكتشاف الأدوية والمعلوماتية الجزيئية.

ومن ثم، يمكننا أن نرى أن كافة قطاعات الصناعة والأوساط الأكاديمية والبحثية قد تسارعت وتيرة الأبحاث ذات الصلة في السنوات الأخيرة. في عام 2022، سيتعاون مركز قوانغتشو الوطني للحوسبة الفائقة مع جامعة صن يات صن وشركة ستار لتكنولوجيا الأدوية ومعهد ماساتشوستس للتكنولوجيا ومعهد جورجيا للتكنولوجيا لبناء حاسوب فائق يعتمد على قدرات الحوسبة والتخزين القوية لتيانخه-2.تم اقتراح أداة BioNavi-NP للملاحة في المسار الحيوي الرجعي القائم على التعلم العميق.

وفي عالم الأعمال، تتسارع أيضًا الأبحاث المتعلقة بالمنتجات الطبيعية. في عام 2023، توصلت مجموعة Tasly Pharmaceutical Group وHuawei Cloud إلى اتفاقية تعاون. سيقوم الطرفان بدمج بيانات الأبحاث الحديثة للمنتجات الطبيعية وما إلى ذلك.المشاركة في بناء نموذج كبير عمودي في مجال الطب الصيني التقليدي.

ومع ذلك، تظل قواعد بيانات المنتجات الطبيعية تشكل تحديًا كبيرًا في عملية البحث العلمي. حاليًا، تشمل مستودعات بيانات المنتجات الطبيعية الرئيسية في العالم الحد الأدنى من معلومات مجموعات الجينات الحيوية الاصطناعية (MIBiG)، وخريطة المنتجات الطبيعية (NP Map)، والشبكة الجزيئية العالمية للمنتجات الطبيعية (GNPS)، وقاعدة بيانات الرنين المغناطيسي للمنتجات الطبيعية (NP-MRD)، وغيرها. ومع ذلك، تعاني هذه القواعد من ضعف التغطية ومشاكل شائعة في أخطاء البيانات، مما أعاق تقدم الذكاء الاصطناعي في اكتشاف أدوية المنتجات الطبيعية.

في السنوات الأخيرة، تم ترشيح العديد من الباحثين، ومن بينهم العالم الصيني تو يويو، والعالم الياباني أومورا ساتوشي، والعالم الأيرلندي ويليام سي كامبل، لجائزة نوبل في الكيمياء لإنجازاتهم في التركيب الكامل للمنتجات الطبيعية. ليس هناك شك في أنه مع استمرار ظهور أهمية المنتجات الطبيعية، فإن دمج الذكاء الاصطناعي في أبحاث المنتجات الطبيعية على وشك أن يتسارع.