التنبؤ ببنية البروتين/شرح الوظيفة/التعرف على التفاعل/التصميم حسب الطلب، فريق Zhang Shugang من جامعة المحيط الصينية يتعامل بشكل مباشر مع المهام الأساسية للحوسبة الذكية للبروتين

تلعب البروتينات، باعتبارها الناقل الرئيسي للأنشطة الحيوية، دورًا محوريًا في الوظائف الفسيولوجية البشرية. ومع ذلك، تواجه الأبحاث التقليدية تحدياتٍ مثل ارتفاع تكلفة التحليل الهيكلي، والتأخر الكبير في التوضيح الوظيفي، وانخفاض كفاءة تصميم بروتينات جديدة. في السنوات الأخيرة، ازداد الطلب على تحليل الخصائص المعقدة للبروتينات في علوم الحياة إلحاحًا. وقد أتاح التطور الهائل لتقنيات مثل البيانات الضخمة، والتعلم العميق، والحوسبة متعددة الوسائط فرصةً جديدةً لتطوير نظام حوسبة ذكي للبروتينات. وقد مكّن هذا النظام البروتينات من تحقيق نتائج باهرة في مجالات التوضيح الوظيفي واسع النطاق، والتنبؤ بالتفاعلات، ونمذجة البنية ثلاثية الأبعاد، مما يوفر مسارًا تقنيًا جديدًا لاكتشاف الأدوية ومحاكاة أنظمة الحياة.
في مؤتمر بكين تشي يوان 2025، تحدث الأستاذ المشارك تشانغ شوغانغ من كلية علوم الكمبيوتر بجامعة المحيط الصينية حول موضوع "بناء وتطبيق نظام الحوسبة الذكية للبروتين" في منتدى "الذكاء الاصطناعي + العلوم والهندسة والطب".انطلاقًا من القيمة الأساسية لنظام الحوسبة الذكية للبروتين، يشرح البحث بشكل منهجي الاختراقات التقنية لأربع مهام أساسية: التنبؤ ببنية البروتين، والشرح الوظيفي، والتعرف على التفاعلات، والتصميم الجديد.وتم تسليط الضوء على نتائج الأبحاث ذات الصلة التي أجراها الفريق.

قامت شركة هايبر إيه آي بجمع وتلخيص مداخلة الأستاذ المشارك تشانغ شوغانغ المُعمّقة دون المساس بالهدف الأصلي. وفيما يلي نصّ الكلمة.
نظرة عامة على نظام الحوسبة الذكية للبروتين: ثورة مدفوعة بالذكاء الاصطناعي في علوم الحياة
في أبحاث علوم الحياة، تتجلى أهمية البروتين بوضوح. فهو ليس مجرد إنزيم يُحفّز التفاعلات الكيميائية الحيوية، بل هو أيضًا ناقل للإشارات، ويشكل الأساس الهيكلي للجسم، وسلاح الجهاز المناعي لمقاومة الأعداء الخارجيين. ومع ذلك، تبدو أساليب البحث التقليدية عاجزة أمام الخصائص المعقدة للبروتينات. فقد أصبحت مشاكل مثل التكلفة العالية للتحليل الهيكلي، والتأخر الكبير في التوضيح الوظيفي، وانخفاض معدل نجاح تصميم البروتين، تحدياتٍ جسيمة.
لقد قلب إدخال تقنية الذكاء الاصطناعي هذا الوضع تمامًا. في عام ٢٠٢٤، مُنحت جائزة نوبل في الكيمياء لإنجازاتٍ في مجال التنبؤ ببنية البروتين وتصميمها باستخدام الذكاء الاصطناعي، مما برهن بلا شك، مجددًا، على أهمية الذكاء الاصطناعي في أبحاث البروتينات.يحقق الحوسبة الذكية للبروتين محاكاة فعالة وتوقع خصائص البروتين المعقدة من خلال بناء نماذج خوارزمية تعتمد على البيانات.كما أنه يوفر أفكارًا ونماذج بحثية جديدة لمعالجة التحديات المذكورة أعلاه ويفتح حقبة جديدة لأبحاث علوم الحياة.
اختراق في المهمة الأساسية للحوسبة الذكية للبروتين
القضايا الأساسية المتعلقة بالحوسبة الذكية للبروتين هي الفئات الأربع التالية:
هل يمكن التنبؤ ببنية البروتين من الصفر؟
من مفارقة ليفينثال إلى تخريب AlphaFold
إذا أخذنا طي البروتين كمثال، فإن البروتين الذي يحتوي على 100 بقايا قد يحتوي على ما يصل إلى 10 تكوينات محتملة.200 إذا كان هناك بحث عشوائي، فإن الوقت المطلوب أطول بكثير من عمر الكون (13.8 مليار سنة)، وهي مفارقة ليفينثال الشهيرة. ومع ذلك، يمكن إتمام طي البروتين فعليًا في غضون ميلي ثانية إلى دقائق، مما يشير إلى وجود مسار طي محدد.
في عام 2018، حاول الجيل الأول من نموذج AlphaFold حل المشكلة باستخدام أساليب التعلم العميق، باستخدام وحدة الالتفاف المتبقية للتنبؤ بالمسافة وزاوية الالتواء لأزواج الأحماض الأمينية.وفي تجربة CASP13، تفوقت على المنافسين الآخرين بهامش كبير، حيث تمكنت من التنبؤ بشكل دقيق بـ 25 بنية بروتينية.صاحب المركز الثاني توقع 3 فقط بشكل صحيح.
في عام ٢٠٢١، حقق نموذج الجيل الثاني نقلة نوعية. استخدم AlphaFold2 برمجيتي HMMER وHH-suite لمحاذاة تسلسلات متعددة والبحث عن قوالب.من خلال 48 وحدة Evoformer و 8 وحدات Structure، يتم تحقيق التنبؤ ببنية البروتين بدقة ذرية.نُشرت قاعدة بيانات تحتوي على حوالي 214 مليون تنبؤ بمونومر البروتين. لا يتجاوز متوسط الخطأ بين البنية المتوقعة ونتائج تحليل المجهر الإلكتروني عرض ذرة واحدة، مما يُحقق معيار "الدقة العالية".
بحلول عام ٢٠٢٤، سيتمكن نموذج الجيل الثالث من تحقيق تنبؤ كامل ببنية تفاعل البروتينات داخل الجسم الحي. وقد حقق AlphaFold3 نقلة نوعية، إذ لا يقتصر على التنبؤ ببنية البروتينات فحسب، بلويمكنه أيضًا التنبؤ ببنية المجمعات المكونة من البروتينات والأحماض النووية والجزيئات الصغيرة والأيونات وكل جزيئات الحياة الأخرى.ويغطي تقريبًا جميع الأنواع الجزيئية في قاعدة بيانات PDB، مما يوفر أداة قوية لفهم وظائف الخلايا وعلاج الأمراض.
هل يمكن شرح وظائف البروتين تلقائيًا: اختراق في دمج البيانات متعددة المصادر
نظراً للتقدم التطلعي الذي أحرزته AlphaFold3 في مجال التنبؤ بالبروتينات، قرر فريقنا تحويل تركيز البحث إلى مجال شرح وظائف البروتينات وتحليل تفاعلاتها. حالياً، من بين 250 مليون تسلسل بروتيني في العالم، لم يُنجز سوى 0.5% شرحاً وظيفياً دقيقاً. لم يتمكن النموذج التقليدي، الذي يعتمد على التحليل اليدوي من قِبل خبراء بيولوجيين، من مواجهة تحديات البيانات الضخمة. لذلك، أصبح استخدام التعلم العميق لتحقيق شرح دفعي واسع النطاق إنجازاً هاماً.
بدأ استكشافنا في هذا المجال في عام 2022. بهدف معالجة نقطة الألم في الصناعة المتمثلة في أن البيانات الهيكلية للمجهر الإلكتروني، والتي يعتمد عليها التعلم العميق، نادرة ومكلفة،نقترح بشكل مبتكر استخدام بيانات البنية الافتراضية التي يتنبأ بها AlphaFold2 في تدريب النموذج.هذه الاستراتيجية، المشابهة لاستراتيجية "تحسين البيانات"، وسّعت نطاق بيانات التدريب بشكل ملحوظ - من 5 ملايين عينة توفرها المجاهر الإلكترونية التقليدية إلى مجموعة بيانات تنبؤية ضخمة نظريًا تضم مئات الملايين. يُظهر التحقق التجريبي أن النموذج المُدرّب بناءً على بيانات التنبؤ لا يتفوق على النموذج الأصلي فحسب، بل يمكنه أيضًا اكتشاف وظائف بروتينية جديدة لم تُحددها الطرق التقليدية.
عنوان الورقة:تحسين أداء التنبؤ بوظائف البروتين من خلال الاستفادة من هياكل البروتين المتوقعة بواسطة AlphaFold
عنوان الورقة:
https://pubs.acs.org/doi/10.1021/acs.jcim.2c00885
من حيث الابتكار التكنولوجي،لتناول مشكلة عدم كفاية استخراج المعلومات حول بنية البروتين، اقترح فريقنا طريقة للتنبؤ بوظيفة البروتين تعتمد على الاهتمام بالرسم البياني الخاضع للإشراف الذاتي.من خلال تشفير معلومات الارتباط بين البقايا داخل جزيء البروتين والاستفادة الكاملة من معلومات المسافة بين البقايا كمهمة مساعدة، يمكن تحسين أداء التنبؤ بوظيفة البروتين.
عنوان الورقة:SuperEdgeGO: تعلم تمثيل الرسوم البيانية الخاضعة للإشراف على الحافة لتحسين التنبؤ بوظائف البروتين (منشور قادم)

لتناول مشاكل ميزات البروتين غير المتجانسة التي يصعب دمجها والتي تكون غير متسقة مكانيًا، تم اقتراح استراتيجية بناء البروتين ذات العرض المزدوج وطريقة محاذاة الميزات.بناءً على الخصائص المعقدة للبروتينات البيولوجية ذات ستة أوضاع عبر المقاييس (تغطي أبعادًا مثل التسلسل والبنية ثلاثية الأبعاد والمجال الوظيفي)،واقترح الفريق أيضًا استراتيجية اندماج متعددة الوسائطدمج أساليب التعلم التبايني وتحليل متعدد المشاهد في مجال الحوسبة لبناء نموذج دمج هرمي للخصائص. قورن هذا الحل بعشرين أسلوبًا أساسيًا شائعًا على 7 مجموعات بيانات، وقد حققت جميعها نتائج تحليل البيانات المتزامنة (SOTA)، وحلّت بنجاح المشكلة التقنية المتمثلة في تدهور الأداء الناتج عن الربط المباشر للوسائط.
عنوان الورقة:شرح وظائف البروتين من خلال دمج الوسائط البيولوجية المتعددة
عنوان الورقة:https://www.nature.com/articles/s42003-024-07411-y



بالإضافة إلى ذلك، في دراسة إمكانية تفسير التنبؤ الوظيفي،وأظهر النموذج أيضًا قدرة ممتازة على تحديد أكثر من 10 وظائف بروتينية بدقة من آلاف التعليقات التوضيحية لـ GoTerms.بالإضافة إلى ذلك، وجد الفريق من خلال البحث في الأدبيات أن بعض الدراسات سجلت حالات توقع فيها النموذج أخطاءً ولكنه أعطى ثقة عالية، مما يشير إلى أن هذه الحالات ربما أُسيء تقديرها بسبب تأخر إصدار مجموعة البيانات. يُبرز هذا الاكتشاف إمكانات نماذج الذكاء الاصطناعي في استكشاف وظائف بروتينية جديدة.
هل يمكن تحديد تفاعلات البروتينات بدقة؟ تُمكّن النماذج المُطوّرة ذاتيًا من التنبؤات الفعّالة.
في مجال تطوير الأدوية، يُعدّ الالتحام الدقيق للبروتينات كأهداف بشرية مفتاح فعالية الأدوية، وقد أظهرت تقنية الذكاء الاصطناعي قيمةً كبيرةً في هذه العملية. على الرغم من الأداء الجيد لبرنامج AlphaFold3 في مجال التنبؤ ببنية البروتين، إلا أن هناك قيودًا واضحةً في تطبيقاته العملية: فنسخته المجانية لا تدعم سوى 20 زيارةً يوميًا، وتغطي حوالي 15-20 نوعًا من الجزيئات، كما أن التقدم بطلب للحصول على حقوق الاستخدام التجاري أمرٌ بالغ الصعوبة، مما دفع الفريق إلى تطوير نموذجه الخاص.
وبناءً على هذه المشكلة، ركز الفريق على المهام التالية:
أولاً، استهدفنا مشاكل التفاعلات التآزرية الضعيفة في طرق التنبؤ بالتفاعلات البروتينية الموجودة.تم تقديم نموذج التعلم التوأمي في المشفر لتعزيز الاتساق التعاوني لتمثيل البروتين، وتم اقتراح إطار عمل للتعلم التعاوني مع آلية تعاون التفاعل البروتيني وآلية تعاون المهام.استخدم الفريق الانتباه التفاعلي وطرق التعلم متعدد المهام لتحقيق تنبؤات تفاعلية للبروتين والحمض النووي، والبروتين والبروتين والجزيء الصغير.
كما قام الفريق بدمج الشبكات العصبية المحولة والرسمية في مجال معالجة اللغة الطبيعية وتطوير وحدات مثل Convformer و Graphormer لتحقيق النمذجة التفاعلية عن بعد.تُستخدم آلية الانتباه المتقاطع لتعزيز دمج المعلومات متعددة الوسائط. يُظهر النموذج قدرة تعميم قوية في السيناريوهات الفعلية. بأخذ التنبؤ بمسار إشارات سرطان البنكرياس كمثال، يتجاوز معدل دقته 95%، مع 9 أزواج فقط من أخطاء التنبؤ بالتفاعل.
عنوان الورقة:SSPPI: التنبؤ بالتفاعلات البروتينية المعززة عبر الوسائط من منظور التسلسل والبنية (منشور قادم)

الخط الأسود: التنبؤ الصحيح؛ الخط الأحمر: التنبؤ الخاطئ
في أبحاث حديثة، بالإضافة إلى تقليل أبعاد البروتينات عبر المقاييس على مستوى الشبكة، نلتزم أيضًا باستخراج خصائص البروتينات. ونظرًا لأن نماذج الرسوم البيانية التقليدية تُسبب فقدانًا للمعلومات عند تقليل المعلومات الهيكلية ثلاثية الأبعاد إلى بعدين، فقد قدمنا أحدث تقنيات التعلم العميق الهندسي.تم اقتراح طريقة تعلم هندسي عميق تعتمد على استراتيجية تمرير الرسائل الهجينة، وتم إنشاء نموذج كامل لتكامل المعلومات ثلاثي الأبعاد.يهدف هذا النموذج إلى حل مشكلة عدم عقلانية تجاهل المعلومات ثلاثية الأبعاد في نمذجة الموقع المكاني وتوفير أفكار بحثية جديدة في مجال نمذجة البروتين ثلاثية الأبعاد.
عنوان الورقة:التعلم العميق الهندسي للتنبؤ بتقارب البروتين والربيطة باستخدام استراتيجيات تمرير الرسائل الهجينة (منشور قادم)

أيضًا،لقد أجرينا أيضًا اختبارات فعلية على بروتين ACSS2 وقمنا بفحص العديد من المركبات المرشحة من بين عشرات الآلاف من المركبات.تشير نتائج التنبؤ بالنموذج إلى أن تقارب المركبات التي تم فحصها يمكن أن يصل إلى مستوى النانومولار، مما يُظهر إمكانات دوائية جيدة؛ تعاون فريقنا مع فريق كلية الطب بجامعة تشينغداو لإجراء التحقق، كما تم تأكيد نتائج الالتحام بشكل أولي في التجارب الرطبة التي أجريت مؤخرًا.

هل يمكن تصميم بروتينات جديدة حسب الطلب: من المشكلات العكسية إلى التطبيقات المبتكرة
يُعد تصميم البروتين أحد الأهداف الأساسية لأبحاث البروتين، وله أهمية بالغة في تطوير اللقاحات وعلاج السرطان وتطوير المواد الحيوية. ومع ذلك، وباعتباره مشكلة عكسية لطي البروتين، يواجه تصميم تسلسل البروتين أيضًا تحديات مثل اتساع مساحة البحث وأخطاء محاكاة مجال القوة التقليدية.
لمواجهة المشكلة الجوهرية المتمثلة في تصميم البروتينات الذكية وتحسينها، نأخذ هنا أحدث أعمال فريق بيكر، الحائز على جائزة نوبل العام الماضي، كمثال. لا يوجد ترياق محدد لسم الثعبان. هل من الممكن تصميم نوع جديد من البروتينات بالاعتماد على الحاسوب؟ بناءً على هذه المشكلة، جمع فريق بيكر بين تقنيتي ProteinMPNN وRFDiffusion السابقتين لتصميم بروتين جديد. بالإضافة إلى ذلك، صمم فريقه أيضًا بروتينات ربط محددة لسموم الثعابين، مما وفر حلاً جديدًا لتحييد سمومها القاتلة. نُشرت الورقة البحثية ذات الصلة في المجلة الرئيسية لمجلة Nature في أوائل عام 2025. تُظهر نتائج هذه الأبحاث الإمكانات الهائلة للذكاء الاصطناعي في مجال تصميم البروتينات، وقد خطت خطوات ثابتة نحو تحقيق هدف "المبدع" المتمثل في "تصميم بروتينات جديدة".
الحوسبة عبر المقاييس لأنظمة الحياة المعقدة: محاكاة السلسلة الكاملة من المقياس النانوي إلى المقياس الكبير
نظام الحياة نظام معقد متعدد المقاييس. من مستوى الجينات النانوية إلى مستوى الخلايا العيانية، يتفاعل كل مقياس ويؤثر على الآخر. خلال زيارتي لمجموعة أبحاث البروفيسور تشانغ هينغوي في جامعة مانشستر بالمملكة المتحدة، أجريتُ بحثًا يتعلق بالقلب الرقمي. بعد عودتي إلى الصين، أجريتُ المزيد من الأبحاث على الخلايا الرقمية. وخلافًا لنموذج "الدافع الرقمي" مثل القلب الرقمي،واقترح الفريق طريقة نمذجة متعددة المقاييس للأنشطة الحياتية المجهرية تعتمد على نهج البناء "المعتمد على البيانات" وقاموا ببناء نظام طريقة الحوسبة المجهرية ثلاثي الأبعاد "التمثيل - الحالة - المقياس".ويغطي 36 نقطة بحثية، ويوجد حاليًا مقالات أو براءات اختراع متراكمة تحت ما يقرب من ثلث الأساليب.
بالإضافة إلى ذلك، تحت إشراف البروفيسور وي تشي تشيانغ،لقد قمنا حديثا بتعريف نظام الحياة المجهرية على أربعة مستويات من المقياس.بما في ذلك مستوى الجين النانوي، ومستوى البروتين "المجهري"، ومستوى مسار الإشارة "المتوسط"، ومستوى الخلية "العياني"، يتم تحقيق محاكاة نظام الحياة الكامل، على أمل تحقيق اقتران كامل النطاق من الذرات إلى القلب.

نبذة عن الأستاذ المشارك تشانغ شوغانغ
تشانغ شوغانغ هو أستاذ مشارك ومشرف ماجستير في كلية علوم الكمبيوتر بجامعة المحيط الصينية، وعضو بارز في CCF، وعضو مراسل في لجنة المعلوماتية الحيوية CCF، وعضو في لجنة الرعاية الصحية الذكية CAAI، ومدير جمعية المعلوماتية الحيوية في شاندونغ، ومدير المؤسسة الوطنية للعلوم الطبيعية في الصين، ومشروع نفقات الأعمال البحثية العلمية الأساسية للجامعات المركزية، إلخ. تم اختياره لبرنامج دعم المواهب المبتكرة لما بعد الدكتوراه في شاندونغ لعام 2020.
مجالات بحثه الرئيسية هي علم الأحياء الحاسوبي وعلم المعلومات الحيوية، بما في ذلك بناء القلب الرقمي عالي الدقة، والتنبؤ بوظائف البروتين وتصميمها، وغيرها. في السنوات الأخيرة، نشر أكثر من 30 بحثًا في مجلات ومؤتمرات دولية موثوقة مثل IEEE JBHI وJCIM وnpj Systems Biology and Applications، مع أكثر من 1600 استشهاد على Google Scholar.