استنادًا إلى 86000 بيانات عن بنية البروتين، تم استخدام طريقة التعلم الآلي جنبًا إلى جنب مع حسابات ميكانيكا الكم لاكتشاف 69 رابطة جديدة بين النيتروجين والأكسجين والكبريت

في "مصنع" الخلية، يكون الرابط بين النيتروجين والأكسجين والكبريت (NOS) بمثابة "مفتاح ذكي" قابل للعكس يمكنه تنظيم نشاط الإنزيم وفقًا للتغيرات الأكسدة والاختزال في البيئة. في عام 2021، اكتشف فريق من جامعة جورج أوغست في جوتنجن، ألمانيا، الرابطة NOS بين اللايسين والسيستين من خلال دراسة الترانس ألدولاز في النيسرية البنية.يتجاوز هذا البحث نطاق دراسات مسببات الأمراض والإنزيمات الفردية ويضع أساسًا مهمًا لعلم البروتين متعدد التخصصات وتصميم الأدوية والهندسة الحيوية.
ومع ذلك، مع النمو الهائل لبيانات بنية البروتين واستمرار البحث في الروابط الكيميائية في بنية البروتين من قبل المجتمع العلمي، ظهرت أيضًا مشاكل جديدة.هل هناك روابط NOS أو تفاعلات كيميائية أخرى تم تجاهلها؟
وبناء على الاعتبارات المذكورة أعلاه،قامت صوفيا بازي وشرارة سيد من جامعة جورج أوغسطس بتطوير خوارزمية مبتكرة في علم الأحياء الحسابي، SimplifiedBondfinder.وهذا يفتح فصلاً جديدًا في استكشاف الروابط التساهمية البروتينية.قام الفريق بدمج التعلم الآلي وحسابات ميكانيكا الكم لبناء قاعدة بيانات عالية الدقة لبلورات الأشعة السينية وقاموا بتحليل أكثر من 86000 بنية بروتينية عالية الدقة للأشعة السينية بشكل منهجي.ولم يتم اكتشاف 69 رابطة NOS جديدة فحسب، بل تضمنت أيضًا روابط NOS جديدة تشكلت بين الأرجينين (Arg)-السيستين والجلايسين (Gly)-السيستين والتي لم تتم ملاحظتها من قبل.
أدى هذا الاكتشاف الثوري إلى توسيع نطاق كيمياء البروتين وجعل التنظيم المستهدف ممكنًا في تصميم الأدوية وهندسة البروتين.وعلى الرغم من أن هذه الدراسة ركزت على رابطة NOS، إلا أنه يمكن تطبيق هذا النهج بشكل مرن لدراسة مجموعة واسعة من الروابط الكيميائية الأخرى والتعديلات التساهمية.يتضمن تعديلات ما بعد الترجمة القابلة للحل هيكليًا (PTMs).
نُشرت نتائج البحث في مجلة Communications Chemistry تحت عنوان "الكشف عن ارتباطات NOS بين الأرجينين والسيستين والجلايسين والسيستين من خلال إعادة تقييم منهجية لهياكل البروتين".
أبرز الأبحاث:
* كسر الاعتقاد العلمي الشائع بأن روابط NOS موجودة فقط بين اللايسين (Lys) والسيستين، تم الكشف عن آلية تنظيم الأكسدة والاختزال الجديدة لروابط NOS بين الأرجينين والسيستين والجليسين والسيستين لأول مرة بطريقة مبتكرة
* الطريقة المقترحة تدمج التعلم الآلي والحسابات الميكانيكية الكمومية وبيانات علم البلورات بالأشعة السينية عالية الدقة، مما يحل تحدي عدم وجود خوارزميات منهجية لاكتشاف الروابط الكيميائية في هذا المجال من البحث، والانفصال عن قيود التجارب التقليدية، وتوفير أداة موثوقة وسهلة الاستخدام للأبحاث اللاحقة.
* من خلال تقنيات التعلم الآلي والذكاء الاصطناعي، تم تخفيض تكلفة مثل هذه الأبحاث بشكل كبير مع تحسين كفاءة البحث، مما يمثل مثالاً لتقنيات التعلم الآلي في فك رموز وظائف البروتين وتحديد تفاعلات البروتين الجديدة

عنوان الورقة:
https://www.nature.com/articles/s42004-025-01535-w
مزيد من أوراق البحث الرائدة في مجال الذكاء الاصطناعي:
https://go.hyper.ai/UuE1o
مجموعة البيانات: استخراج مجموعات بيانات موثوقة مع طبقات متعددة من القيود
البيانات التي تم جمعها بواسطة SimplifiedBondfinder تأتي من ثلاث قواعد بيانات بروتينية مختلفة.قواعد البيانات هي PDB وPDB-REDO وBDB. ستخضع البيانات المجمعة لقيود مختلفة لتصفية مجموعات البيانات الموثوقة والقابلة للاستخدام. من بينها، تعمل قاعدة بيانات PDB-REDO (اعتبارًا من يناير 2024) على تحسين البنية الثابتة في PDB وجعلها أكثر توافقًا مع معايير علم البلورات المعاصرة. بالمقارنة مع قاعدة بيانات PDB الأصلية، تتميز بدقة وموثوقية أعلى. كما هو موضح في الجانب الأيسر من الشكل أدناه:

وعلى وجه التحديد، استخدم فريق البحث وظائف متعددة مترابطة لتحريك عملية توليد البيانات تلقائيًا في قاعدة بيانات تحتوي في البداية على 170251 بيانات بروتينية.استخدم الفريق في البداية بيوبايثون (الإصدار 1.79) لإجراء تحليل هيكلي (باستخدام MMCIFParser وPDBParse) وحساب خصائص ذرية وبقايا أخرى. بعد تحليل البنية المحددة بالأشعة السينية فقط، حسّن فريق البحث بيانات 170,127 بروتينًا.
وبعد ذلك، ومن أجل تحسين دقة التنبؤ بشكل أكبر، قام فريق البحث بفحص هياكل البروتين بدقة ≤ 2 Å، وحصل في النهاية على 86491 بنية للتحليل التجريبي.
لبناء مجموعة بيانات لدراسة رابطة كيميائية محددة،قام فريق البحث بوضع معايير تعتمد على أنواع الذرات المكونة، وأسماء البقايا، والمسافات بين الذرات، والإشغال.بالنسبة لاتصالات NOS التي تتضمن ذرات الكبريت (S) والنيتروجين (N) في البقايا القياسية، حدد فريق البحث المسافة بين الذرات لـ SN، أي dist(S, N)، إلى ≤ 3.2 Å، وهو ما يتوافق مع قيمة الحد الأقصى لتفاعلات التكافؤ بين اللايسين والسيستين، وضبط عتبة الإشغال إلى > 0.8 لاستبعاد الذرات ذات عدم اليقين الموضعي العالي. باستخدام هذا المعيار، حددت الدراسة 25,462 اتصالاً بـ NS.
ولضمان تصوير الكتلة الذرية المستهدفة، طبق فريق البحث أيضًا قيمة R في الفضاء الحقيقي (RSRZ) مع ضبط الحد على <2.0 لضمان إمكانية تحديد تطابقات موثوقة مع البيانات في الفضاء الحقيقي.تم تقليص مجموعة البيانات إلى 23,129 جهة اتصال NS.وقد سمح هذا للأهداف التجريبية بالتركيز بشكل رئيسي على نوعين من تفاعلات السيستين: التفاعل بين ذرة الكبريت في السيستين والنيتروجين الأساسي في الجلايسين؛ والتفاعل بين ذرة الكبريت في السيستين والنيتروجين الجانبي في الأرجينين والليسين.
التالي،استخدم فريق البحث وحدة NeighborSearch في Biopython لاستخراج المعلمات الهيكلية، وجمع 15 واصفًا مختلفًا لكل عينة في كل مجموعة بيانات.وتشمل هذه الزوايا (∡CSN، ∡CNS)، وزوايا الالتواء (φCS-NC)، والمسافات الأخرى (dist(C، N)، وdist(S، N))، وقيم مساحة السطح التي يمكن الوصول إليها بالمذيب (SASA) للذرات المستهدفة والبقايا المقابلة المحسوبة بشكل أكبر باستخدام Bio.PDB.SASA.
أدرج فريق البحث عوامل B الذرية (Bfac) في التجربة لتحديد معامل الحركة الذرية المستهدف في التحليل. جاءت هذه القيم من قاعدتي بيانات: RCSB PDB وقاعدة بيانات ملفات PDB (BDB) مع عوامل B متسقة.
ومن الجدير بالذكر أنه بناءً على المتطلبات المحددة لهذه الدراسة، تم اختيار 15 واصفًا فقط في التجربة.ومع ذلك، قال فريق البحث إن الخوارزمية المقترحة لا تحتوي على حد صارم لعدد الوصافات التي يمكنها معالجتها.من خلال التصميم، يمكنه استيعاب عدد عشوائي من الوصافات، مما يتيح له دمج المعرفة الخاصة بالمجال أو التكيف مع الأساليب التجريبية الجديدة.
هندسة النموذج: دمج التعلم الآلي والحوسبة الميكانيكية الكمومية
والجزء أعلاه هو الخطوة الأولى في الخطوات الرئيسية للطريقة المقترحة، والتي تتمثل في إنشاء مجموعة بيانات مستهدفة للروابط الكيميائية المحددة وتطبيق معايير صارمة.يركز هذا القسم على الخطوة الرئيسية الثانية للطريقة المقترحة، وهي استخدام تقنيات التعلم الآلي لاستكشاف هذه البيانات عالية الأبعاد.تحديد الوصافات البنيوية الفعالة والتنبؤ بالمواقع المحتملة لتكوين الرابطة التساهمية.

كما هو موضح في الصورة أعلاه.أولاً، طبق فريق البحث تقنية تقليل الأبعاد غير الخاضعة للإشراف لتقريب وإسقاط متعدد الشعب الموحد (UMAP) مع أقصى بعد تضمين يبلغ 3.ثم يتم تنفيذ التجميع التحولي المتوسط على جميع مجموعات الوصافات الممكنة.
في،يحافظ UMAP بشكل مثالي على الخصائص الطوبولوجية والهندسية الجوهرية للبيانات عالية الأبعاد، مما يضمن الحفاظ على الميزات الهيكلية الأساسية في التضمينات منخفضة الأبعاد.يُسهّل هذا التحليل اللاحق الهادف. يعتمد اختيار بُعد التضمين في UMAP على الخصائص الطوبولوجية والهندسية لمجموعة البيانات ومتعددها الأصلي عالي الأبعاد. في التطبيقات العملية، تُعد التضمينات ثنائية الأبعاد أو ثلاثية الأبعاد الأكثر قابلية للتفسير، لأنها تُتيح تصورًا بديهيًا وتقييمًا لجودة التجميع.
في هذه الدراسة، وفّرت أبعاد التضمين الثلاثة مجموعاتٍ منفصلةً وذات معنىً جيدًا، مما يُبرّر هذا الاختيار. تُظهر نتائج تحليل الروابط الكيميائية والتجميع أن طريقة تقليل الأبعاد هذه هي الأمثل لمجموعة البيانات المستخدمة في هذه التجربة. يُمكن أن يُحافظ اختيار أبعاد تضمين أعلى من اللازم على السمات الشائعة الأصلية، ولكنه سيزيد من تكلفة الحوسبة دون تحسين قابلية التفسير. في المقابل، سيؤدي تقليل الأبعاد إلى ما دون المستوى الأمثل إلى فقدان كبير للمعلومات وضعف فصل المجموعات.
ثم،حصل فريق البحث على درجة الظل لجميع إحداثيات التضمين ثلاثية الأبعاد لتقييم جودة التجميع لكل مجموعة.تُخرِج الخوارزمية مجموعات، ومعاملات صورة ظلية، وترابط الهدف المرجعي داخل كل مجموعة. يُحدَّد كل مرشح باسم ذرة الهدف، واسم البقايا المقابلة، ورقم البقايا، والسلسلة، ومعرف قاعدة بيانات البروتين (PDB) لتمييز جميع ذرات الهدف داخل البروتين.
ولإيجاد مساحة المعالم النهائية والدنيا، استخدم فريق البحث عدة معايير، بما في ذلك قيمة معامل الصورة الظلية، وعدد المجموعات التي ينتجها كل مساحة معالم، وتوزيع اتصالات المرجع والهدف في هذه المجموعات.
خاصة،هدف فريق البحث إلى تحديد مساحة مميزة يمكنها تقسيم البيانات بشكل فعال إلى مجموعتين أو ثلاث مجموعات مميزة مع معامل صورة ظلية ≥ 0.5.في الوضع الأمثل، لا تحتوي إحدى المجموعات على أي اتصالات هدف مرجعية، وهو ما يُسمى "مجموعة مستحيلة". عمليًا، يُعدّ الحد الأدنى لعدد العينات المرجعية في هذه المجموعة مقبولًا. أما المجموعات المتبقية التي تحتوي على جميع أو معظم اتصالات الهدف المرجعية، فتُسمى "مجموعات ممكنة".
من خلال تقديم مجموعات مرشحة محتملة ومستحيلة تحتوي على الروابط الكيميائية المستهدفة،تمكن فريق البحث من تحديد مساحات مميزة للتمييز بين أزواج الذرات المستهدفة التي من المرجح أن تشكل روابط كيميائية جديدة وتلك التي من غير المرجح أن تشكل مثل هذه الروابط.بمجرد تحديد مجموعة من الواصفات التي تُميز بين هذه الحالات بدقة، لا حاجة لإضافة واصفات إضافية. يتميز هذا النهج بمزايا من حيث الكفاءة الحسابية وسهولة التفسير، ويمكن أن يُحسّن بشكل كبير دقة التنبؤ بأساليب تحديد تكوين الروابط الكيميائية الجديدة داخل هياكل البروتينات.
بالإضافة إلى التعلم الآلي، فإن الطريقة المقترحة في هذه الدراسة تدمج أيضًا الحسابات الميكانيكية الكمومية.أجرى الباحثون تحسينًا هندسيًا للمرشحين المحتملين لارتباط NOS في معقدات Lys-NOS-Cys، وGly-NOS-Cys، وARG-NηOS-Cys، وARG-NεOS-Cys. أُجري التحسين الهندسي في الماء باستخدام حزمة البرامج Gaussian16 – A.03 (Gaussian 16، المراجعة C.01) عند مستوى نظرية B3LYP-D3 (BJ)/def2-TZVPD. بالنسبة للهياكل المُحسّنة، حُسبت العديد من المعاملات الهندسية تجريبيًا، بما في ذلك المسافة بين ذرات الكبريت والنيتروجين (dist (S, N))، بالإضافة إلى الزوايا (∡CSN، ∡CNS، ∡NOS).
من أجل التحقق من وجود الروابط التساهمية NOS المتوقعة بواسطة طريقة التجميع المقترحة،استخدم فريق البحث برنامج phenix.refine (الإصدار 1.20.1-4487-000) لإعادة تحسين أربعة هياكل بروتينية تمثيلية؛أُجريَ تحققٌ هيكليٌّ شاملٌ باستخدام phenix.molprobity لتقييم الجودة الهندسية، ودرجات التصادم، والتفاعلات الفراغية، لضمان الاتساق مع بيانات البلورات عالية الدقة؛ وأُنشئ تقرير تحققٍ كاملٌ باستخدام phenix.table1، يُلخّص إحصاءات التحسين، ومقاييس جودة النموذج، والانحرافات الكيميائية الفراغية. وقد أكّدت خطوات التحقق هذه سلامةَ بنية وصلة NOS وتوافقها مع خريطة كثافة الإلكترونات.
النتائج التجريبية: الروابط Arg-NOS-Cys و Gly-NOS-Cys هي روابط تساهمية معقولة
ولإثبات فعالية الطريقة المقترحة، أجرى فريق البحث عددًا من التجارب، مستكشفًا استخدام تقنيات التعلم الآلي لاختيار الموصوف، والأهمية الكيميائية الحيوية لمساحة الموصوف المتعددة، وتحليل العناقيد، والتحقق البنيوي والحراري الديناميكي.
اختيار الوصافات باستخدام التعلم الآلي
قام فريق البحث أولاً بتطبيقه على البيانات حيث من المرجح أن توجد اتصالات Lys-NOS-Cys.تحتوي مجموعة البيانات على 527 زوجًا من الليسين والسيستين وتتضمن أيضًا روابط NOS تم التحقق منها تجريبياً.تم تحديد الوصافات الرئيسية تجريبيا لتكون عامل B لذرة النيتروجين (Bfac(BDB)(N)) وعدد البقايا المجاورة ضمن دائرة نصف قطرها 4 Å من ذرات Cα لليسين (Ngbᴺ) والسيستين (Ngbˢ).
قام فريق البحث بتوسيع التحليل إلى مجموعة بيانات مكونة من 313 زوجًا من الجلايسين والسيستين لاستكشاف الاتصالات المحتملة بين Gly-NOS-Cys، كما هو موضح في الشكل أدناه.

هنا، تتضمن مجموعات الوصف الرئيسية عامل B للبقايا المحتوية على الكبريت (BfacBDBS)، ومسافة الكبريت والنيتروجين (dist(S,N))، وزاوية الكربون والكبريت والنيتروجين (∡CSN).
من حيث الواصفات الرئيسية للتنبؤ بتكوين رابطة NOS بين بقايا الأرجينين والسيستين،تحتوي السلاسل الجانبية للأرجينين على نوعين من ذرات النيتروجين، Nη و Nε، والتي تختلف في الخصائص الهندسية والخصائص الكيميائية.لذلك، قمنا بتحليل مجموعات البيانات Nη (Arg-NηOS-Cys) و Nε (Arg-Nε-Cys) بشكل منفصل.
بالنسبة لـ Arg-NηOS-Cys، تتوافق الواصفات المحددة مع مساحة السطح التي يمكن الوصول إليها بالمذيب لبقايا النيتروجين (SASAᴺ)، ∡CSN، والبقايا المجاورة للكبريت (Ngbˢ) والنيتروجين (Ngbᴺ)؛ وبالمثل بالنسبة لمجموعة البيانات المكونة من 240 زوجًا من Arg-NεOS-Cys، تتضمن الواصفات الرئيسية BfacBDBS، وSASAˢ، ومساحة السطح التي يمكن الوصول إليها بالمذيب لذرة النيتروجين، و∡CSN، و∡CNS.
تظهر هذه النتائج فصلًا واضحًا للعناقيد من خلال التصور المتعلق بتخفيض أبعاد UMAP.كما هو موضح في الشكل أدناه، يُمثل اللونان الأزرق السماوي والأزرق الملكي عواملَ رابطة NOS المُرشَّحة، بينما يُمثل اللون البرتقالي "التجميع المُستحيل"، وتُمثل المربعات السوداء مجموعة البيانات المرجعية. يتضح جليًا أن توزيع العينات التي قد تُشكِّل روابط NOS يتداخل بشكل كبير مع توزيع النقاط المعيارية المرجعية.

الأهمية الكيميائية الحيوية لمساحة الوصف متعددة الأبعاد
قام فريق البحث باستكشاف الأهمية الكيميائية الحيوية للواصفات الرئيسية، والتي كانت مهمة للتمييز بين الروابط NOS من الروابط غير NOS، من خلال تحديد مجموعة دنيا من الوصافات بطريقة خوارزمية.
بأخذ عامل B كمثال، يُظهر عامل B في مجموعات مختلفة أنماط توزيع مختلفة. وكما هو موضح في A(a) أعلاه، تختلف أنماط عامل B في "التجميع المحتمل" و"التجميع المستحيل".يرتبط عامل B بمرونة الذرات أو المناطق، وعادةً ما تحتوي بقايا الموقع النشط على عامل B أقل، مما يشير إلى أنها مرتبطة بنشاط الإنزيم.ومع ذلك، أشار فريق البحث أيضًا إلى أن انخفاض عامل B قد يشير إلى ارتباط NOS، لكنه قد يعكس أيضًا تفاعلات أخرى بين النيتروجين والكبريت.
فيما يتعلق بخصائص الوصف لروابط NOS التي تشكلها بقايا الأحماض الأمينية المختلفة، فإن BfacBDBᴺ هو العامل الرئيسي الذي يميز المجموعتين في Lys-NOS-Cys؛ بالنسبة لاتصالات Gly-NOS-Cys، فإن ∠CSN هو الوصف الرئيسي الذي يميز مجموعات اتصالات NOS المحتملة، مع ∠CSN >80° لمعظم العينات المحتملة وقيمة ∠CSN للمجمع Gly-NOS-Cys الأمثل تكون حوالي 94°؛ لا يزال ∠CSN هو المحدد الرئيسي للتمييز بين اتصالات NOS المحتملة من المستحيلة لاتصالات Arg-NεOS-Cys.
تحليل المجموعات
وفي هذا التقييم، اكتشف فريق البحث 65 رابطة Lys-NOS-Cys، ورابطتين Gly-NOS-Cys (الشكلان أ و ب أدناه) ورابطتين Arg-NηOS-Cys (الشكلان ج و د أدناه).

من خلال النمذجة الصريحة وإعادة التحسين، تمكن فريق البحثبعد إدخال روابط NOS، تحسنت قيمة Rwork/Rfree بمعدل 0.5%، كما تم تقليل ذروة كثافة الإلكترون غير المبررة بشكل كبير.بالنسبة لـ 3G2K، توجد ذروة كثافة إلكترونات سالبة حول السلسلة الجانبية للأرجينين في البنية الأصلية، والتي تنخفض بشكل ملحوظ بعد إعادة توزيع تكوين الأرجينين. بالإضافة إلى ذلك، توجد قمم فرق موجبة بالقرب من السلسلة الجانبية للأرجينين في كلا النموذجين. ونظرًا لسعتها الكبيرة ووجود ثنائي ميثيل سلفوكسيد، فقد تمثل جزيئات مذيب غير مُمثلة في النموذج الحالي.
التحقق الهيكلي والديناميكي الحراري
وللتأكيد بشكل أكبر على العلاقة بين Arg-NOS-Cys وGly-NOS-Cys، جمع فريق البحث بين تحسين الهندسة الميكانيكية الكمومية والتقييم الديناميكي الحراري لأربعة مجمعات بروتينية تمثيلية (6PGD، 6T3X، 3MWB، و3G2K) لشرح التباين الكيميائي المحتمل في الجسم الحي بشكل منهجي.
من حيث التحقق البنيوي، في نموذج الرابطة المحسن NOS، تتراوح مسافة SN من 2.61 إلى 2.70 Å، وهو قريب جدًا من الفاصل 2.63 إلى 2.89 Å لهيكل PDB-REDO الأصلي.أدت عمليات المحاكاة التي تمت مع إزالة ذرة الأكسجين الجسرية إلى زيادة كبيرة في فصل المستعر الأعظم إلى 3.36-4.26 Å، مما يشير إلى أن مسافات المستعر الأعظم الأقصر التي لوحظت تجريبياً تتفق مع وجود ذرة أكسجين وسيطة.
من حيث التقييم الديناميكي الحراري، قام فريق البحث بحساب طاقة جيبس الحرة (ΔG) تحت حالات بروتونية مختلفة، مما يدل على أن جميع عمليات تكوين رابطة NOS سلبية.يشير هذا إلى أن استبدال ذرة هيدروجين بذرة أكسجين لتكوين رابطة NOS ممكن ترموديناميكيًا في الحالة المُحاكاة. ومع ذلك، يختلف مقدار ΔG اختلافًا كبيرًا باختلاف حالة البروتون، وبين المُركبات المُشتقة من الأرجينين والجليسين. في كلا النظامين، يُفضّل الجلايسين المُتعادل أو الأرجينين على الحالات المُوجبة الشحنة. تُظهر المُركبات المُشتقة من الجلايسين قيم ΔG أعلى قليلًا. وبينما تُشير هذه القيم إلى ارتباط مُناسب ترموديناميكيًا، إلا أنها أقل نفاذيةً للطاقة بشكل منهجي من مُركبات الأرجينين المُناظرة.
عند أخذ هذه النتائج البنيوية معًا، فإنها تقدم دليلًا ثابتًا على أنتبين أن الروابط Arg-NOS-Cys و Gly-NOS-Cys هي روابط تساهمية معقولة وليست اتصالات بسيطة غير مرتبطة.وفي الوقت نفسه، يشير الاتفاق بين الأشكال الهندسية المحسنة ميكانيكيًا الكموميًا والبيانات البلورية للنظام البلوري، بالإضافة إلى الطاقات الحرة السلبية للتكوين، بقوة إلى أن هذه الاتصالات ممكنة من الناحية البنيوية والطاقة في بيئة البروتين ذات الصلة.
التعلم الآلي يفتح فصلاً جديدًا في العالم المجهري للبروتينات
كما ذُكر في الورقة البحثية، أثبت التطور السريع لتقنيات التعلم الآلي والذكاء الاصطناعي تفوقها على أساليب الكيمياء الحيوية التقليدية في حل المشكلات المعقدة في الكيمياء الحيوية. وبفضل انخفاض تكلفة الحوسبة وكفاءتها العالية، حفزت هذه التقنيات مجتمع البحث العلمي على إحداث ثورة كبيرة في "أساليب الإنتاج"، كما عززت التقنيات المعتمدة على التعلم الآلي لتُظهر إمكانات أكبر في فك رموز وظائف البروتينات وتحديد تفاعلاتها الجديدة.
بالصدفة، نشر كيفن ك. يانغ وآخرون من معهد كاليفورنيا للتكنولوجيا مقالًا بعنوان "التطور الموجه بالتعلم الآلي لهندسة البروتينات" في مجلة Nat. Methods.من خلال مقارنة التطور الموجه والتطور الموجه بمساعدة التعلم الآلي، يتم تفسير تفوق التعلم الآلي.في الوقت نفسه، تسرد المقالة أيضًا حالات عملية مثل كفاءة التحفيز الإنزيمي وتحسين الاستقرار الحراري لسيتوكروم بي 450، وتذكر مجموعة متنوعة من طرق التعلم الآلي مثل الانحدار الخطي، والعملية الغوسية، والتحسين البايزي.ويُظهر ذلك أن التعلم الآلي يمكن أن يوفر "ملاحة ذكية تعتمد على البيانات" للهندسة البروتينية.من خلال نمذجة علاقات التسلسل والوظيفة، يمكن تحسين كفاءة ومعدل نجاح التطور الموجه بشكل كبير.
عنوان الورقة:
https://arxiv.org/pdf/1811.10775
بالإضافة إلى ذلك، نشرت ريتا كاساديو وآخرون من جامعة بولونيا في إيطاليا مقالاً بعنوان "حلول التعلم الآلي للتنبؤ بالتفاعلات بين البروتينات"، والذي تناول أيضًا استكشاف التعلم الآلي في أبحاث البروتين.يقدم هذا الكتاب تطبيق أساليب التعلم الآلي بما في ذلك التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف في التفاعلات الجزيئية بين البروتينات (PPI).يتم تسليط الضوء على القضايا الرئيسية في جودة البيانات، والتمثيل، وخوارزميات التدريب، وإجراءات التحقق.
عنوان الورقة:
https://wires.onlinelibrary.wiley.com/doi/full/10.1002/wcms.1618
بشكل عام، لا يزال هناك العديد من الرموز المتعلقة بالحياة مخفية في العالم المجهري للبروتين، والطريقة المنهجية القائمة على البيانات مع التعلم الآلي كوسيلة رئيسية هي بلا شك بمثابة مفتاح لفتح الباب إلى العالم المجهري للبروتين، مما يلهم مجتمع البحث العلمي لإجراء المزيد من الأبحاث المتعمقة واستكشاف وظيفة البروتين واستقراره، وبالتالي كسر قيود الإدراك البشري للحياة باستمرار.