التفكيك الكامل للغاية لـ AlphaFold 3، تشونغ بو زيتاو من جامعة شنغهاي جياو تونغ: الاستخدام المفرط للبيانات للتنبؤ ببنية جميع الجزيئات الحيوية بدقة ذرية، لكنه ليس مثاليًا

أثار برنامج AlphaFold 3، الذي يمكنه التنبؤ ببنية وتفاعلات جميع الجزيئات الحيوية بدقة ذرية، نقاشًا واسع النطاق في الصناعة بمجرد إصداره. في 13 أغسطس، في مدرسة الذكاء الاصطناعي للهندسة الحيوية الصيفية بجامعة شنغهاي جياو تونغ،قام الدكتور تشونج بوزيتاو بفرز تجربة التعلم الخاصة به بشكل منهجي مع موضوع "AlphaFold 3: المبادئ والتطبيقات والآفاق"، وقام بفرز العديد من نتائج الأبحاث ذات الصلة من مجتمع البحث العلمي على نطاق واسع، وشارك رؤيته العميقة في AlphaFold 3 مع الجميع.لقد قامت HyperAI بتنظيم المحتوى الأساسي للكلام دون انتهاك القصد الأصلي. وفيما يلي نص الخطاب:

مع التركيز على التنبؤ ببنية البروتين، سنتحدث اليوم عن AlphaFold 3، وهو حاليًا أفضل أداة للتنبؤ ببنية البروتين والجزيئات البيولوجية الأكثر شمولاً.إن حالة AlphaFold 3 واضحة بذاتها.
يبدأ تخليق البروتين بنسخ الحمض النووي، والذي ينقل بعد ذلك المعلومات الوراثية إلى الحمض النووي الريبوزي (RNA)، والذي يتم ترجمته بعد ذلك إلى بروتين ثم طيه إلى هياكل ثانوية وثالثية ورباعية. تنطوي معظم البروتينات إلى تكوينات فريدة، والمعلومات اللازمة للبنية يتم ترميزها في تسلسل الأحماض الأمينية، وهذا ما نقوله غالبًا: التسلسل يحدد البنية، والبنية تحدد الوظيفة.يعد التنبؤ ببنية البروتين أمرًا بالغ الأهمية لفهم الوظائف البيولوجية.
إنجاز AlphaFold 3: بنية نموذجية مبتكرة وتحسين استخدام البيانات
مقارنة بين عمارة نموذج AlphaFold 3 و AlphaFold 2
في الماضي، تفوقت AlphaFold 2 بشكل مباشر على الخوارزميات الأخرى في التنبؤ ببنية البروتين.يمكن تلخيص بنيتها الأساسية في ثلاثة أجزاء رئيسية، كما هو موضح في الشكل أدناه: الجزء الأول، وحدة MSA والقالب في المربع الأزرق، مسؤول عن جمع ودمج معلومات محاذاة التسلسل المتعددة (MSA) ومعلومات بنية القالب كبيانات إدخال للنموذج. الجزء الثاني، وحدة Evoformer في المربع الأخضر، مسؤولة عن فهم المعلومات التطورية المشتركة في المنظمات متعددة التسلسلات، وتنقية ومعالجة المعلومات المجمعة، وتمريرها إلى وحدة الهيكل في المربع الأرجواني في الجزء الثالث.

من منظور التعلم العميق، يلعب Evoformer دور المشفر، في حين أن Structure Module يعادل جهاز فك التشفير.حصل AlphaFold 2 على الكثير من الإشادة بسبب قدراته الشاملة على التحسين، حيث يقوم بالرسم مباشرة من مدخلات التسلسل إلى المخرجات الهيكلية.
يُعتقد عمومًا أن التغييرات في بنية نموذج AlphaFold 3 ليست كبيرة كما هو متصور. ويتكون إطار النموذج الخاص بها أيضًا من 3 أجزاء رئيسية. المقارنة بين كل جزء و AlphaFold 2 هي كما يلي:
الجزء الأول: الحفاظ على التشابه الكبير
كما هو موضح في الشكل أدناه، من خلال مقارنة مخططات بنية AlphaFold 3 وAlphaFold 2، يمكننا أن نرى أن الجزء الأول من AlphaFold 3 (في المربع الأزرق) لا يزال يتضمن MSA & Template، بالإضافة إلى تقديم رابط إنشاء Conformer.

الجزء الثاني: تقليل الاعتماد على تسلسلات MSA
الجزء الثاني من AlphaFold 3 (في المربع الأخضر) يسمى Pairformer. هيكلها مشابه بشكل أساسي لـ Evoformer، ولكن عدد وحدات MSA انخفض إلى 4. وكما هو موضح في الشكل أدناه، تشير الأسهم الخضراء إلى نفس المحتوى في الوحدتين، وتشير الأسهم الصفراء إلى الاختلافات. كما ترون،يضع AlphaFold 3 المزيد من التركيز على تسلسل البروتين المستهدف ويعتمد بشكل أقل على تسلسل MSA.

علاوة على ذلك، نعتقد أن السبب وراء قدرة AlphaFold 3 على إظهار أداء قوي في مهام متعددة قد يكون لأنه يقلل من اعتماده على محاذاة التسلسل المتعدد (MSA).كما هو موضح في الشكل أدناه، يوضح الجانب الأيمن تأثير MSA على أداء AlphaFold 2: مع زيادة عدد MSAs، بعد تجاوز حد معين (الخط الوردي)، يميل تحسن أداء AlphaFold 2 إلى الاستقرار. كما يمكن أن نرى من الجزء الأوسط من الشكل أدناه، بالمقارنة مع AlphaFold 2، فإن تأثير MSA على AlphaFold 3 يضعف (يتقلب المنحنى قليلاً جدًا).

بالإضافة إلى ذلك، فإن نضوج الأجسام المضادة يتطلب في كثير من الأحيان عملية فرط الطفرة في الجسم الحي. إن معلومات MSA تقدم مساعدة محدودة في التنبؤ ببنيتها، ومن الصعب العثور على معلومات MSA مقترنة للبروتينات ومجمعاتها. ومن وجهة النظر هذه، قد يؤدي توسيع نطاق تطبيق AlphaFold 3 إلى تقليل اعتماده على MSA.
الجزء الثالث: إنشاء بنية ذرية كاملة + إزالة ثبات الدوران المجسم
الجزء الثالث من AlphaFold 3 (في المربع الأرجواني) يعتمد نموذج الانتشار، والذي ينتمي أيضًا إلى فئة وحدة الهيكل. الفرق هو أن نموذج الانتشار يستبدل التحسين التكراري المتكرر في وحدة الهيكل بآلية جديدة تسمى نموذج الانتشار.
*نموذج الانتشار: إضافة الضوضاء إلى النموذج (إلى الأمام)، والسماح للنموذج بإزالة الضوضاء (عكس)، وتعلم العملية العكسية، وإنشاء توزيع بيانات مماثل.
كما هو موضح في الشكل أدناه، في الجزء الثالث، يحقق AlphaFold 3 إنشاء البنية على المستوى الذري بالكامل. قد تحتوي الذرات، باعتبارها اللبنات الأساسية للجزيئات، على معلومات فيزيائية أكثر ثراءً، مما يعني أن AlphaFold 3 قد يلتقط قوانين فيزيائية أعمق عند التنبؤ ببنية البروتين. بالإضافة إلى ذلك، يتخلى AlphaFold 3 عن ثبات الدوران المجسم الذي تم التأكيد عليه في AlphaFold 2. بعد حذف البنية الإضافية لهذه الميزة في AlphaFold 2، وجد الباحثون أن تصميم النموذج (وحدة الانتشار) أصبح أكثر حرية.

AlphaFold 3 يحسن استخدام البيانات
تعتبر موارد بيانات البروتين محدودة، ولكن AlphaFold 3 لا يجعل مجموعة البيانات أكبر فحسب، بل يحسن أيضًا استخدام البيانات.على وجه التحديد، بالمقارنة مع مجموعة البيانات ذات المستوى المليون في AlphaFold 2، فإن AlphaFold 3 يقترب بشكل مباشر من مستوى المليار، ومجموعة التدريب أكبر. علاوة على ذلك، بالإضافة إلى البيانات الموجودة في قاعدة بيانات البروتين، تتضمن مجموعة التدريب الخاصة بها أيضًا كمية كبيرة من البيانات الأخرى. على سبيل المثال، تكون البيانات البنيوية التي يتنبأ بها AlphaFold 2 أكثر دقة باعتبارها توسعًا لمجموعة التدريب. تظهر مجموعة التدريب المحددة في الشكل أدناه:

يحقق AlphaFold 3 قفزة هائلة في نطاق التطبيق
التغيير الأكبر في AlphaFold 3 هو أنه حقق قفزة نوعية في نطاق تطبيقه.في الماضي، كان AlphaFold 2 أكثر تركيزًا على التنبؤ بهياكل الأحماض الأمينية، بينما يمكن لـ AlphaFold 3 التنبؤ بشكل مباشر بالهياكل على المستوى الذري. ويتجلى التوسع الوظيفي على وجه التحديد في الجوانب الأربعة التالية:
* القدرة على التنبؤ الدقيق بالربيطات، أي التنبؤ بمواقع ارتباط الجزيئات الصغيرة في البروتينات؛
* القدرة على التنبؤ ببنية البروتين المعقدة؛
* القدرة على التنبؤ بهياكل التعديل ما بعد الترجمة للبروتينات والأحماض النووية؛
* القدرة على التنبؤ ببنية الحمض النووي DNA والحمض النووي الريبوزي RNA، وكذلك بنية مجمعات الحمض النووي DNA/RNA والبروتينات.
يقوم AlphaFold 3 بتغيير مجال الالتحام بالربيطة
ومن بين أهم التأثيرات التي أحدثها AlphaFold 3 على المجال العلمي هو تحسين مهمة الالتحام بالربيطة.كما هو موضح في الشكل أدناه، يتم تقييم معدلات نجاح خوارزميات التعلم العميق المختلفة في 4 مهام مختلفة لرسو الربيطة بموجب معيار PostBusters. يمكن أن نجد أن AlphaFold 3 يمكنه تحقيق أعلى معدل نجاح، أي 76.4%، تحت فرضية وجود جيوب غير معروفة ومعرفة مسبقة هيكلية.

يختار PostBusters Benchmark 428 بيانات من قاعدة بيانات PDB من عام 2021 وما بعده
المعيار لنجاح المهمة هو أن يكون الانحراف بين موضع الالتحام المتوقع للجزيء الصغير وموضع الالتحام الفعلي أقل من 2 Å
كما هو موضح في الشكل أعلاه، في النوع الأول من مهمة الإرساء الأعمى، مع موضع جيب غير معروف وبنية بروتينية معروفة (لا يوجد جيب، بنية Holo)، يمكن لـ DiffDock تحقيق أعلى معدل نجاح يبلغ 37.9%.
في النوع الثاني من مهمة الطي المشترك (يتم طي الجزيئات الصغيرة وهياكل البروتين)، مع مواضع الجيب غير المعروفة وهياكل البروتين غير المعروفة (لا يوجد جيب، لا يوجد هيكل)، انخفض معدل نجاح التنبؤ المشترك AlphaFold 2+DiffDock إلى 18%،بالإضافة إلى ذلك، حقق AlphaFold 3 أعلى معدل نجاح 76.4%، مما يدل على أن AlphaFold 3 لا يتنبأ بدقة فحسب، بل إنه لا يعتمد أيضًا على المعرفة المسبقة بالجيوب والهياكل.
في الفئة الثالثة من مهام الالتحام التقليدية، يتم معرفة موضع الجيب للجزيء الصغير وبنية البروتين (مع الجيب، بنية الهولوغرام)، أي أن الجيب مكشوف. حقق الذهب نسبة نجاح بلغت 51.2%، وأظهر فينا نسبة نجاح بلغت 52.3%، وارتفع جلايد إلى 55%. يمكن لخوارزميات التعلم العميق الأخرى أيضًا تحقيق مستويات جيدة نسبيًا، مما يشير إلى أن معدل النجاح يتأثر بالجيب.
في الفئة الرابعة من مهام الطي المشترك الموجهة، مع مواضع الجيب المعروفة وهياكل البروتين غير المعروفة (مع الجيب، بدون هيكل)، تم تحسين معدل نجاح النموذج بشكل كبير، من 76.4% إلى 90.2% لـ AlphaFold 3، مما يشير إلى أن معلومات الجيب المعروفة يمكن أن تحسن معدل نجاح المهمة. ومع ذلك، هناك بعض الجدل حول تعريف الجيب.لذلك، إذا كنت تريد معرفة التحسن المحدد الذي أحرزه AlphaFold 3 في مهمة إرساء الربيطة، فيمكنك فقط النظر في معدل نجاح النوع الثاني من المهام، وهو أكثر استقرارًا نسبيًا.
كما هو موضح في الشكل أدناه، هناك اختلافات كبيرة في تعريفات الجيب بين النماذج المختلفة. إن جيب الذهب عبارة عن كرة مقاس 25Å (الجزء الأزرق في الزاوية العلوية اليسرى من الشكل)، بينما يستخدم نموذج Vina مكعب مقاس 25Å كتمثيل للجيب، وحجم جيب DeepDock هو 10Å، وحجم جيب Uni-Mol هو 8Å.

كما هو موضح على الجانب الأيمن من الشكل أعلاه، عندما يتم تقليل حجم جيب نموذج Gold تدريجيًا من 25Å إلى 6Å، فإن معدل نجاح معيار PoseBusters الخاص به مستقر نسبيًا، وهو ما يرجع إلى خصائص خوارزمية Gold القائمة على الفيزياء. في المقابل، قامت خوارزمية التعلم العميق Uni-Mol بتضييق الجيب تدريجيًا إلى 6Å، مع زيادة معدل النجاح إلى 68%، ثم الانخفاض إلى الصفر عند 25Å، مما يعكس اعتماد بعض خوارزميات إرساء التعلم العميق على الجيب.
وبالمثل، كما ذكرنا سابقًا، بعد تقديم معلومات الجيب، تم تحسين معدل نجاح الالتحام لـ AlphaFold 3 بشكل كبير من 76.4% إلى 90.2%.باختصار، تلعب المعلومات الجيبية دورًا رئيسيًا في تحسين معدل نجاح التنبؤ بالنموذج. ولكن من الناحية المثالية، سيكون النموذج الذي يمكنه تحقيق دقة عالية دون معلومات جيبية أو هيكلية هو خيارنا الأفضل، مثل AlphaFold 3.
يتيح AlphaFold 3 التنبؤ ببنية الأجسام المضادة والمستضدات
تطبيق آخر لـ AlphaFold 3 هو التنبؤ ببنية الأجسام المضادة والمستضدات. على الجانب الأيسر من الشكل أدناه يوجد تقييم أداء AlphaFold 3 للتنبؤ ببنية الأجسام المضادة والمستضدات. بموجب معيار تقييم أقل (DockQ>0.23)، مع تشغيل واحد فقط، يكون معدل نجاح AlphaFold 3 أقل من 40% (الخط الأزرق الفاتح)، ولكن بعد 1000 محاولة، يمكن تحسين معدل نجاح التنبؤ إلى 60%.

* اليسار: التنبؤ ببنية الأجسام المضادة، حيث تمثل كل نقطة بيانات متوسط درجة 1000 بذرة تم اختيارها عشوائيًا من بين 1200 بذرة
* يمين: عندما يكون مؤشر التقييم DockQ أكبر من 0.23، فيمكن اعتبار أن الدقة الهيكلية لم يتم التحقق منها بعد؛ عندما يتجاوز DockQ 0.8، يكون التنبؤ الهيكلي دقيقًا للغاية
علاوة على ذلك، إذا تم قياسه بمعيار أكثر صرامة (DockQ> 0.8)، فقد يكون معدل نجاح تشغيل واحد منخفضًا مثل 10%، ومن خلال زيادة عدد التشغيلات إلى 1000، يمكن زيادة معدل النجاح إلى 30%.يوضح هذا أنه يمكننا تحسين معدل نجاح التنبؤ ببنية مستضد الأجسام المضادة عن طريق زيادة عدد عمليات AlphaFold 3 (البذور لكل هدف).
ومع ذلك، وكما هو موضح على الجانب الأيمن من الشكل أعلاه، لا يمكن لـ AlphaFold 3 تحسين معدل النجاح إلا من خلال زيادة عدد مرات التشغيل عند التنبؤ ببنية مجمعات البروتين-البروتين. ويُظهر هذا أن إمكانية تطبيق AlphaFold 3 للتنبؤ بأنواع أخرى من الهياكل المعقدة تحتاج أيضًا إلى مزيد من التحسين.
يتيح AlphaFold 3 التنبؤ بالتعديل التساهمي
كما هو موضح في الشكل أدناه، يُظهر AlphaFold 3 أيضًا قدرات تنبؤ هيكلية ممتازة من حيث التنبؤ بالتعديل.يمكن أن يصل معدل النجاح إلى حوالي 80%، و60%، و40%. من المؤكد أن AlphaFold 3 يعد أداة قوية للباحثين المشاركين في التعديلات التساهمية.

حدود AlphaFold 3 في التنبؤ ببنية الحمض النووي الريبي
في الوقت الحالي، لا يزال التنبؤ ببنية الحمض النووي الريبي أمرًا صعبًا.كما هو موضح في الشكل أدناه، فقد حقق AlphaFold 3 تحسنًا كبيرًا في أداء التنبؤ مقارنةً بنموذج RoseTTAFoId2NA. ومع ذلك، عند التنبؤ ببنية RNA لـ CASP15، تكون دقة AlphaFold 3 أقل من دقة نموذج Alchemy_RNA2 (يحتوي على مدخلات بشرية).

مقارنة إيجابيات وسلبيات AlphaFold 3 في المهام المختلفة
من خلال تحليل منحنى تدريب AlphaFold 3، يمكننا أن نرى بوضوح أداء النموذج في المهام المختلفة. كلما ارتفع مؤشر LDDT، كان ذلك أفضل.كما هو موضح في الشكل أدناه، يعمل النموذج بشكل أفضل في التنبؤ بالهياكل داخل الربيطة؛ كما يظهر دقة عالية في التنبؤ بالهياكل داخل البروتين؛ كما يعمل النموذج بشكل جيد في التنبؤ بالهياكل داخل الحمض النووي، وذلك بفضل البنية الحلزونية المزدوجة المستقرة للحمض النووي؛ على النقيض من ذلك، فإن أداء النموذج ضعيف في التنبؤ بالهياكل داخل الحمض النووي الريبي.

بالانتقال إلى مجال التنبؤ بالمعقدات، كان أداء النموذج أفضل في التنبؤ ببنية مجمع البروتين-الربيطة، يليه التنبؤ بمجمع البروتين-البروتين. في التنبؤ بمجمع البروتين-الحمض النووي، انخفض أداء النموذج، وكان أداء التنبؤ بمجمع البروتين-الحمض النووي الريبي هو الأسوأ. وتعكس هذه النتيجة أيضًا صعوبة التنبؤ ببنية الحمض النووي الريبي. تعتبر البيانات البنيوية للحمض النووي الريبي نادرة، والبنية ديناميكية ومرنة، وهو أحد التحديات الحالية التي تواجه مجال البيولوجيا البنيوية.
بالإضافة إلى ذلك، عندما استخدم الباحثون AlphaFold 3 للتنبؤ بالبنية،يمكن أيضًا تقييم موثوقية نتائج التنبؤ من خلال جدول PAE.

AlphaFold 3 ليس مثاليًا
AlphaFold 3 ليس مثاليًا. على سبيل المثال، قد يختار الكيرالية الخاطئة.في حالة حدوث أي حالة غير طبيعية أثناء التشغيل، يوصى بإجراء الاختبار عدة مرات للتحقق من استقرار النتائج. ثانيًا، يواجه AlphaFold 3 أيضًا قيودًا في التنبؤ بديناميكيات البروتين، وقد يكون ذلك بسبب نقص البيانات البنيوية وعدم القدرة على استيعاب المعلومات التكوينية متعددة الأبعاد للبروتينات.
*إذا كان الجسم مختلفًا عن صورته المرآتية فإنه يسمى "كيرالي" ولا يمكن فرض صورته المرآتية على الجسم الأصلي، تمامًا كما أن اليدين اليسرى واليمنى هما صورتان مرآتيتان لبعضهما البعض ولا يمكن فرضهما على بعضهما البعض.
بالإضافة إلى ذلك، يعاني AlphaFold 3 أيضًا من مشكلة شائعة في النماذج التوليدية، ألا وهي الهلوسة.كما هو موضح في نتائج التنبؤ ببنية البروتين أدناه، لا يمكن حل سوى المنطقة الرمادية من بنية البروتين على اليسار، وقد يكون الباقي في حالة غير مطوية بسبب كثافة الإلكترون غير الكافية. الصورة الوسطى هي نتيجة تنبؤ AlphaFold 2 للبروتين. تعتبر المنطقة الزرقاء في حالة مطوية، وتعتبر أجزاء "الشريط" الأخرى غير مطوية. إن البنية المتوقعة معقولة نسبيًا. على اليمين توجد نتيجة التنبؤ الخاصة بـ AlphaFold 3، والتي تميل إلى طي جميع المناطق القابلة للطي الممكنة. يبدو هذا الهيكل معقولاً، لكن في الواقع، معظم المناطق المذكورة أعلاه ليست مطوية فعلياً.لذلك، يميل وهم AlphaFold 3 إلى التنبؤ بالبروتينات على أنها مطوية بدلاً من الاحتفاظ بحالتها غير المطوية المحتملة.

لمعالجة مشكلة الهلوسة في AlphaFold 3،اختار الباحثون طريقة مباشرة وفعالة: نظرًا لأن النتائج التي تنبأ بها AlphaFold 2 معقولة نسبيًا، فسيتم دمج النتائج التي تنبأ بها AlphaFold 2 في مجموعة بيانات التدريب الخاصة بـ AlphaFold 3 لتعزيز تأثير تدريب النموذج. ومع ذلك، فإن هذه الطريقة لها حد: إذا كانت هناك أخطاء في التنبؤ بـ AlphaFold 2 نفسه، فقد يؤثر ذلك على جودة التنبؤ بـ AlphaFold 3، ما لم يتم إدخال مصادر بيانات أخرى لتحسين النموذج بشكل أكبر.
بالإضافة إلى ذلك، عندما يتم إرسال 256x OLA كمدخل إلى AlphaFold 3، تظهر النتيجة المتوقعة بنية تشبه الطبقة الثنائية، كما هو موضح في الشكل أدناه.هذا البناء غير متوقع أو نموذجي.

بالإضافة إلى ذلك، فإن AlphaFold 3 ليس دقيقًا في التنبؤ ببنية RNA وDNA.كما هو موضح في الشكل أدناه، تظهر أيضًا أزواج تكميلية غريبة عند التنبؤ ببنية الحمض النووي الريبي، مثل G:G، G:A، وما إلى ذلك.

حدود استخدام AlphaFold 3
على افتراض أن البيانات ليست سرية للغاية، يمكن لأي شخص الوصول إلى AlphaFold 3 من خلال الموقع الإلكتروني المقدم من Google. ومع ذلك، فإن المنصة لديها أيضًا بعض القيود. كما هو موضح في الشكل أدناه، من حيث تعديل البروتين، يدعم AlphaFold 3 حاليًا عددًا محدودًا فقط من التعديلات في 3 مواضع محددة، بإجمالي 23 نوعًا. تعديل الحمض النووي يدعم 9 أنواع فقط، وتعديل الحمض النووي الريبي يدعم 15 نوعًا فقط، والأيونات المعدنية تدعم 10 معادن مختلفة فقط، والربيطات محدودة بـ 14 جزيئًا صغيرًا.

لذلك، ونظراً للقيود المحددة المذكورة أعلاه، قد لا يكون AlphaFold 3 قادراً على التعامل مع معظم الأبحاث وردود الأفعال، وقد يضطر إلى الانتظار حتى يصبح مفتوح المصدر حقاً.
باختصار، حقق AlphaFold 3 إنجازات كبيرة في توسيع نطاق التنبؤ الخاص به، متجاوزًا نماذج الذكاء الاصطناعي الحالية، لكن أداءه في مهام محددة لا يزال بحاجة إلى التحسين، وخاصة في التنبؤ بالهياكل الدقيقة.لذلك، وعلى الرغم من أن AlphaFold 3 قد أحرز تقدماً كبيراً، إلا أنه لا تزال هناك حاجة إلى مواصلة البحث والجهود لحل بعض المشاكل المعقدة بشكل كامل.
نبذة عن تشونغ بو زيتاو

تشونج بوزيتاو هو حاليًا طالب دكتوراه في الذكاء الاصطناعي في جامعة شنغهاي جياو تونغ. تشمل اتجاهاته البحثية الرئيسية التنبؤ ببنية البروتين ووظيفته عالية الإنتاجية، وتوليد تكوين البروتين، وما إلى ذلك. وقد نشر أكثر من 20 ورقة بحثية منذ عام 2019، ونشر نتائج تحليل التنبؤ ببنية AlphaFold عالية الإنتاجية للعلاقة بين بروتيوم أعماق البحار والمسارات الأيضية في مجلة Nature Communications. فاز بالميدالية الذهبية في مسابقة الآلات المعدلة وراثيًا الدولية (iGEM) ثلاث مرات وكان قاضيًا في المسابقة عدة مرات.
جوجل سكولار:
https://scholar.google.com/cita