كيف تُسهم المجموعات الضخمة من البيانات في دفع عجلة النماذج الذكية الاصطناعية الحديثة في مجال البيولوجيا
في يونيو، كشفت جوجل ديب مايند عن نموذجها الجديد "ألفا جينوم" (AlphaGenome)، الذي يُعدّ خطوة متقدمة في تطبيق الذكاء الاصطناعي على البيولوجيا الجزيئية. بينما ركّز نموذج ألفا فولد السابق على تنبؤ طريقة طي البروتينات، يركز ألفا جينوم على فهم كيفية تأثير التغيرات الجينية على العمليات التي تتحكم في تشغيل الجينات وتوقيت ومكان تفعيلها. يعتمد النموذج على كميات هائلة من البيانات الجينومية، التي تم جمعها عبر مشاريع علمية طويلة الأمد مثل "موسوعة عناصر الحمض النووي" (ENCODE) ومشروع "النمط الجيني والتعبير النسيجي" (GTEx)، اللذين تم إنشاؤهما في العقد الماضي بقيادة معهد برواد. أشارت جوجل إلى أن ENCODE، الذي سجّل أكثر من مليون عنصر تنظيمي في الجينوم البشري، وGTEx، الذي يُسجّل أنماط التعبير الجيني في أنسجة بشرية وقردة، هما المصدران الرئيسيان لتدريب النموذج. هذه المشاريع غيرت فهمنا للجينوم، إذ أثبتت أن جزءًا كبيرًا من الجينوم غير المشفر ليس "نفايات" كما كان يُعتقد، بل يلعب دورًا حاسمًا في تنظيم الجينات. وقد ساهمت هذه الموارد في تأسيس مبادرات ضخمة مثل مبادرة "تأثير التغيرات الجينية على الوظيفة" التابعة لـ NIH، ومشروع "الأنسجة البشرية"، و"مراقبة تنظيم الجينات" (GRO) في برواد. في مقابلة مع كريستين أردي، المديرة العلمية لمشروع GTEx، وبراد بيرنشتاين، المدير العلمي لمشروع ENCODE، أشارا إلى أن الأهداف الأصلية كانت فهم "لغة الجينوم" وتحديد كيفية عمل الجينات في الخلايا. بيرنشتاين لفت إلى أن هذه المشاريع غيرت مفهوم الجينوم، وبيّنت أن ما يقارب 20% من الجينوم له وظائف تنظيمية. أما أردي، فأكدت أن GTEx تم إطلاقه لفهم كيف تؤثر التغيرات الجينية غير المشفرة، التي تُكتشف غالبًا في دراسات الأمراض، على التعبير الجيني في الأنسجة. أظهرت نتائج ألفا جينوم مدى فعالية هذه الموارد كبيانات تدريب، حيث أصبحت مصادر مفتوحة ومتاحة للجميع، ما يعزز قدرتها على دعم الابتكار العلمي. ويشير الباحثان إلى أن مستقبل الذكاء الاصطناعي في الجينوم يكمن في بناء موارد جديدة تركز على التغيرات البيولوجية الحيوية، مثل التطور البشري أو تطور الأمراض، وجمع بيانات على طول هذه المراحل. كما يُستخدم الذكاء الاصطناعي في مشاريع أخرى داخل برواد، مثل تحليل التنظيم الجيني باستخدام التعلم العميق، ورسم الهيكل ثلاثي الأبعاد للجينوم، وفهم التفاعلات البعيدة بين العناصر الجينية. ومع ذلك، يشير بيرنشتاين إلى أننا ما زلنا نفتقر إلى بيانات واسعة عن التغيرات الجينية المُثبّطة في الخلايا البشرية، ويقترح جمع بيانات من خلايا مُعدّلة جينيًا لفهم القواعد التنظيمية بدقة أكبر. في الختام، يرى الباحثان أن النماذج الكبيرة مثل ألفا جينوم قد تُحدث ثورة في فهم الجينوم، وتساعد في حل جدل حول أفضل طريقة لتحليل التغيرات الجينية: هل ندرسها واحدة تلو الأخرى، أم نستخدم نماذج شاملة تُحلل القواعد النظامية؟ مع استمرار تطوير البيانات الأساسية، يُتوقع أن يصبح الذكاء الاصطناعي أداة لا غنى عنها في فهم الجينوم وعلاج الأمراض.
