HyperAI

أطلقت شركة DeepMind تطبيق AlphaGenome، الذي يتنبأ بتأثيرات الطفرات على جميع الوسائط وأنواع الخلايا في ثانية واحدة

特色图像

تضيف سلسلة Alpha من Google DeepMind عضوًا جديدًا - AlphaGenome،ويمكنه التنبؤ بشكل أكثر شمولاً ودقة بكيفية تأثير اختلاف واحد أو طفرة في تسلسل الحمض النووي البشري على سلسلة من العمليات البيولوجية التي تنظم الجينات.

يأخذ نموذج AlphaGenome تسلسل DNA يصل إلى مليون زوج قاعدي كمدخل ويتنبأ بآلاف الخصائص الجزيئية المتعلقة بنشاطه التنظيمي.في الوقت نفسه، يمكن تقييم تأثير التباين أو الطفرة الجينية بمقارنة نتائج التنبؤ بالتسلسلات المتغيرة وغير المتغيرة. بُني هذا النموذج على أساس نموذج إنفورمر الجينومي السابق من ديب مايند، وهو مُكمّل لنموذج ألفاميسنس الذي يُركز على تصنيف اختلافات مناطق ترميز البروتين.

صرح جون تشنغ، المؤلف المشارك الأول في البحث، على حسابه الشخصي على موقع X: "أخطاء ربط الحمض النووي الريبوزي (RNA) سبب شائع للعديد من الأمراض. ولأول مرة، قمنا ببناء نموذج موحد يمكنه التنبؤ في آنٍ واحد بتغطية تسلسل الحمض النووي الريبوزي (RNA-seq)، ومواقع الربط، واستخدام المواقع، وتقاطعات الربط المحددة التي تُشكلها، مما يُقدم صورةً أكثر شمولاً للصورة العامة لنتائج الربط". كما أشار إلى أنأحد أهم الإنجازات التي حققها مشروع AlphaGenome هو "القدرة على التنبؤ بالوصلات الوصلية مباشرة من التسلسلات واستخدامها للتنبؤ بتأثيرات المتغيرات".

وقال الدكتور كالب لاريو من مركز ميموريال سلون كيترينج للسرطان: "يعتبر هذا إنجازاً بارزاً في هذا المجال".للمرة الأولى، أصبح لدينا نموذج يجمع بين السياق الطويل ودقة القاعدة الفردية والأداء المتطور.فتحت شركة DeepMind نسخة معاينة لمستخدمي الأبحاث غير التجاريين من خلال واجهة برمجة التطبيقات AlphaGenome وتخطط لإصدار النموذج رسميًا في المستقبل.

* رابط البحث:

https://go.hyper.ai/w9Jes

استنادًا إلى مليون تسلسل DNA ومعلومات الأنواع، باستخدام تصميم يشبه U-Net

كما هو موضح في الشكل أ أدناه، يأخذ نموذج التعلم العميق AlphaGenome 1 ميجا بايت (مليون قاعدة) من تسلسل الحمض النووي ومعلومات الأنواع (الإنسان/الفأر) كمدخلات.5930 موضعًا في الجينوم البشري أو 1128 موضعًا في جينوم الفأر للتنبؤ بأنواع الخلايا المختلفةيغطي 11 نوعًا من المخرجات، بما في ذلك:

* التعبير الجيني (RNA-seq، CAGE، PRO-cap)

* أنماط الوصل التفصيلية (مواقع الوصل، وتكرار استخدام موقع الوصل، ومفاصل الوصل)
* حالة الكروماتين (DNase، ATAC-seq، تعديل الهيستون، ربط عامل النسخ)

* خريطة اتصال الكروماتين

نظرة عامة على نموذج AlphaGenome

من حيث هندسة النموذج،يتبنى AlphaGenome تصميمًا معماريًا أساسيًا يشبه U-Net.كما هو موضح في الشكل (أ) أدناه، يمكن معالجة تسلسل الإدخال بكفاءة في نوعين من تمثيلات التسلسل:

التضمينات أحادية الأبعاد (دقة 1 زوج أساسي و128 زوج أساسي): تمثل تسلسلات جينومية خطية وتستخدم لتوليد تنبؤات بالمسارات الجينومية.
* التضمينات ثنائية الأبعاد (دقة 2048 زوجًا قاعديًا): تمثل التفاعلات المكانية بين أجزاء الجينوم وتستخدم للتنبؤ بخرائط الاتصال الزوجية.

نظرة عامة على نموذج AlphaGenome

تُستخدم الطبقات التلافيفية للنموذج لنمذجة أنماط التسلسل المحلية لدعم التنبؤات الدقيقة، بينما تُستخدم وحدات المحول لنمذجة التبعيات طويلة المدى، مثل التفاعلات بين المعززات والمحفزات. يمكن تدريب النموذج على قاعدة واحدة بتسلسل كامل بحجم 1 ميجابايت، بفضل التوازي التسلسلي الموزع، ويمكن تشغيله على 8 أجهزة TPUv3 مترابطة.

من حيث التدريب النموذجي،اعتمد الباحثون على مرحلتين من التدريب، وهما التدريب المسبق والتقطير.في مرحلة ما قبل التدريب، يتم استخدام البيانات التجريبية الموجودة لتدريب نوعين من النماذج، كما هو موضح في الشكل ب أدناه:

* نماذج مخصصة للطي:أُجري التدريب باستخدام نهج التحقق الرباعي، أي استخدام ثلاثة أرباع أجزاء الجينوم المرجعي للتدريب، وترك الربع المتبقي للتحقق والاختبار. واستُخدمت هذه النماذج لتقييم قدرة AlphaGenome على التعميم في التنبؤ بالمسارات الجينومية على أجزاء الجينوم المرجعي غير المرئية.

* نماذج شاملة:يتم تدريب نموذج المعلمين على جميع الأجزاء المتاحة من الجينوم المرجعي كمرحلة التقطير التالية، كما هو موضح في الشكل ج أدناه.

عملية تدريب AlphaGenome

في مرحلة التقطير، قام الباحثون بتدريب نموذج الطالب الذي شارك في بنية تم تدريبها مسبقًا.الهدف هو التنبؤ بالناتج المجمع لنماذج المعلمين المتعددة المطوية بالكامل باستخدام تسلسلات الإدخال المعززة عشوائيًا.أظهرت الدراسات السابقة أن هذا النموذج المقطر يمكنه تحقيق قوة أكبر ودقة أعلى في التنبؤ بالتأثير المتغير (VEP) في نموذج واحد في وقت واحد.

بفضل هذا التصميم، يمكن لنموذج الطالب إكمال مهمة التنبؤ بتأثيرات التباين لجميع الوسائط وأنواع الخلايا بمكالمة جهاز واحدة.في وحدة معالجة الرسوميات NVIDIA H100، تستغرق التنبؤات لكل متغير أقل من ثانية.وهذا يجعلها فعالة للغاية في التنبؤ بتأثيرات التباين واسعة النطاق مقارنة بطرق التكامل متعددة النماذج التقليدية.

تتصدر AlphaGenome العديد من مهام التنبؤ بالجينوم

وفقًا لـ DeepMind، يتمتع AlphaGenome بالمزايا الفريدة التالية مقارنة بالطرق الحالية:

سياق التسلسل الطويل + دقة القاعدة الفردية

يستطيع AlphaGenome تحليل تسلسلات الحمض النووي التي يصل طولها إلى مليون قاعدة، والتنبؤ بها على مستوى القاعدة الواحدة. هذا يسمح له بتغطية مناطق بعيدة من الجينات التنظيمية مع التقاط تفاصيل بيولوجية دقيقة. غالبًا ما ركزت النماذج السابقة على موازنة طول التسلسل مع دقة التنبؤ، مما حدّ من نطاق ودقة الأنماط التي يمكن نمذجتها. يكسر التقدم التكنولوجي الذي حققه AlphaGenome هذا القيد، حيث يستخدم التدريب نصف موارد الحوسبة فقط لنموذج Enformer الأصلي، ويُكمل جلسة تدريب في 4 ساعات فقط.

قدرات التنبؤ الشاملة متعددة الوسائط

يتيح الجمع بين الدقة العالية وتسلسلات الإدخال الطويلة لبرنامج AlphaGenome التنبؤ بأنماط تنظيمية متنوعة بشكل غير مسبوق، مما يوفر للباحثين معلومات أكثر منهجية حول تنظيم الجينات.

تسجيل الطفرات بكفاءة

يستطيع AlphaGenome تقييم تأثير المتغيرات الجينية في ثانية واحدة. بمقارنة الاختلافات المتوقعة في التسلسلات قبل وبعد المتغير، واستخدام أسلوب التلخيص الأنسب لمختلف الحالات، يُمكنه تقييم التأثير المحتمل للمتغيرات الجينية على الآليات الجزيئية بسرعة ودقة.

نمذجة موقع الوصل الجديد

يُمكّن AlphaGenome، بشكل مبتكر، من التنبؤ بموقع تقاطعات الحمض النووي الريبوزي ومستويات تعبيرها مباشرةً بناءً على التسلسلات. ترتبط العديد من الأمراض الوراثية النادرة (مثل ضمور العضلات الشوكي وأنواع معينة من التليف الكيسي) بأخطاء في عملية الوصل، وتُتيح هذه الإمكانية أداةً جديدةً لأبحاث علم الأسباب ذات الصلة.

أداء ممتاز في المعايير

يتفوق AlphaGenome في العديد من مهام التنبؤ بالجينوم، مثل التنبؤ بقرب بنية الحمض النووي، وتأثير الطفرات على التعبير الجيني، والتغيرات في أنماط الربط. وقد تفوق على أفضل النماذج الحالية في 22 من أصل 24 تقييمًا لتوقع تسلسل الحمض النووي، ووصل إلى أو تجاوز أفضل النماذج الحالية في 24 من أصل 26 مهمة لتأثير الطفرات. والأهم من ذلك، أنه النموذج الوحيد الذي يمكنه تقديم تنبؤات مشتركة لجميع طرق التقييم، مما يُظهر تنوعًا كبيرًا.

على وجه التحديد، لتقييم أداء نماذج AlphaGenome،قام الباحثون أولاً بفحص قدرتها على التعميم على أجزاء الجينوم غير المرئية، وهو شرط أساسي لتحقيق التنبؤ عالي الجودة لتأثيرات المتغيرات.أجرى الباحثون ما مجموعه 24 تقييمًا للتنبؤ بالمسار الجينومي، غطّت جميع الأنماط الإحدى عشرة التي تنبأ بها النموذج. في تقييمات التحقق المتبادل خارج الطية، استخدم الباحثون نماذج AlphaGenome مُدرّبة مسبقًا ومُخصصة لكل طية، وقارنوا تنبؤاتهم بأقوى نموذج خارجي حالي في كل مهمة.

وتظهر النتائج أنتفوقت AlphaGenome على النماذج الخارجية المقابلة في 22 من أصل 24 تقييمًا.كما هو موضح في الشكل د أدناه. تجدر الإشارة إلى أنه في مهمة التنبؤ بتغير التعبير الجيني الخاص بنوع الخلية (تغير الطي اللوغاريتمي، LFC)، أظهر AlphaGenome تحسنًا نسبيًا في الأداء قدره +17.4% مقارنةً بنموذج تسلسل متعدد الأنماط آخر من Borzoi، كما هو موضح في الشكل هـ أدناه.

علاوةً على ذلك، تفوّق AlphaGenome أيضًا على النماذج المتخصصة التي ركّزت على نمط واحد في مهام متنوعة. على سبيل المثال:

في التنبؤ بخريطة اتصال الكروماتين،لقد تفوق AlphaGenome على نموذج Orca، كما هو موضح من خلال زيادة قدرها +6.3% في معامل ارتباط بيرسون لخريطة الاتصال وزيادة قدرها +42.3% في الاختلافات الخاصة بنوع الخلية، كما هو موضح في الشكل د أدناه؛

في التنبؤ بمسارات موقع بدء النسخ،يتفوق AlphaGenome على ProCapNet، مع تحسن إجمالي في معامل ارتباط بيرسون بمقدار +15%؛

في التنبؤ بإمكانية الوصول إلى الكروماتين،يتفوق AlphaGenome على ChromBPNet، حيث تحسن بمقدار +8% على ATAC-seq و+19% على DNase-seq.

* الشكل د على اليسار: التحسن النسبي في أداء AlphaGenome في مهام التنبؤ بمسار الجينوم في الوسائط والدقة المختلفة (المعبر عنها بـ %)، حيث تعني PA البولي أدينيلات.
* الشكل هـ: التحسن النسبي في الأداء لـ AlphaGenome في مهمة التنبؤ بتأثيرات المتغيرات الجزئية.

إنجاز صناعي يحظى بإشادة كبيرة

ظل إطلاق هذا النموذج الرائد من قبل شركة AlphaGenome يثير مناقشات ساخنة على تويتر منذ نشر الخبر.

وقال بوشميت كوهلي، نائب رئيس الأبحاث في شركة DeepMind: "يوفر AlphaGenome رؤية شاملة للجينوم البشري غير المشفر من خلال التنبؤ بتأثير المتغيرات في الحمض النووي."إن هذا من شأنه أن يعمق فهمنا لعلم الأحياء المتعلق بالأمراض ويفتح آفاقًا جديدة للأبحاث."في قسم التعليقات، بالإضافة إلى التعجب والثناء، يهتم الجميع أكثر بكيفية استخدامه.

وقال طالب دكتوراه في علم الوراثة من جامعة إدنبرة:"قد يؤدي هذا النموذج إلى إعادة تعريف الطريقة التي نكتشف بها الطفرات المسببة للأمراض وأهداف الأدوية بشكل كامل، وهو أمر ذو أهمية كبيرة."

صرح أحد المعلقين في مجال العلوم البيولوجية بأن "ألفا جينوم ليس مجرد جين واحد، بل هو الجينوم التنظيمي بأكمله. وإذا قورن الحمض النووي بالشيفرة، فإن ألفا جينوم هو البرنامج المكون من شيفرة".

ومن حيث التطبيقات العملية، يتمتع AlphaGenome بإمكانيات بحثية علمية واسعة.على سبيل المثال، مواجهةالبحث في آلية المرض،يُمكنه التنبؤ بدقة أكبر بتأثير التباين الجيني على العمليات التنظيمية، وتحديد التباين المُمْرِض المُحتمل، وكشف أهداف جديدة. وهو مناسب بشكل خاص لدراسة التباين النادر ذي التأثيرات المهمة.يخرجفي مجال علم الأحياء الاصطناعي،توجيه تصميم الحمض النووي للقيام بوظائف تنظيمية محددة، مثل تنشيط جين مستهدف فقط في الخلايا العصبية.يخرجفي أبحاث الجينوميات الأساسية، يمكنتسريع تحديد موقع العناصر الوظيفية الرئيسية وتحديد دورها، والمساعدة في تحديد "التعليمات الأساسية" المطلوبة لتنظيم وظيفة أنواع معينة من الخلايا.

علق البروفيسور مارك منصور من كلية لندن الجامعية قائلاً: "يُوفر مشروع ألفا جينوم حلولاً أساسيةً لتحديد دور المتغيرات غير المشفرة على نطاق واسع، مما يُتيح لنا فهمًا أفضل للأمراض المعقدة مثل السرطان". حاليًا، مشروع ألفا جينوم متاحٌ للبحث لأغراض غير تجارية، ونتطلع إلى المزيد من الإنجازات من المجتمع الأكاديمي بناءً على ذلك.