HyperAIHyperAI
Back to Headlines

علماء من ماساتشوستس يكشفون أسرار نماذج لغة البروتينات ويفتحون "الصندوق الأسود" لفهم كيفية اتخاذها القرارات

منذ 2 أيام

في دراسة جديدة، نجح باحثون من معهد ماساتشوستس للتكنولوجيا (MIT) في كشف أسرار النماذج اللغوية للبروتينات، التي تُستخدم على نطاق واسع في التنبؤ ببنية البروتينات ووظائفها، مما يُسهم في تطوير أدوية ولقاحات جديدة. هذه النماذج، التي تستند إلى نماذج لغوية كبيرة (LLMs) مشابهة لـ ChatGPT، تُحلّل تسلسل الأحماض الأمينية بدل الكلمات، وتُقدّر دقة التنبؤات بدرجة عالية، لكنها تظل "صندوقًا أسود" لا يمكن فهم آلية اتخاذ قراراتها. قائد الدراسة، أوكر جورال، طالب دراسات عليا في MIT، بالتعاون مع بوني بيرجر، أستاذة الرياضيات ورئيسة مجموعة الحوسبة والبيولوجيا في مختبر علوم الحاسوب والذكاء الاصطناعي، وآخرين من MIT، طوّروا تقنية جديدة لتفكيك هذا الصندوق الأسود. استخدموا خوارزمية تُسمى "الكودر المتناثر" (sparse autoencoder)، وهي أداة حديثة ساعدت في توضيح كيفية تمثيل النماذج للبروتينات داخل الشبكات العصبية. في النماذج التقليدية، يتم تمثيل بروتين معين بنشاط محدود لـ 480 عقدة في الشبكة، ما يجعل من الصعب تحديد ما تمثله كل عقدة، لأن المعلومات تكون مختلطة. أما في النموذج الجديد، يُمدد التمثيل إلى 20,000 عقدة، مع شرط الندرة (الندرة في النشاط)، ما يسمح بتوزيع المعلومات بشكل أكثر وضوحًا. أصبحت العقد الآن تُشغّل بشكل أكثر دقة، بحيث تُمثل سمة واحدة فقط، مثل وظيفة معينة أو عائلة بروتينية. بعد الحصول على تمثيلات متناثرة، استخدم الباحثون نموذج ذكاء اصطناعي يُسمى كلاود (Claude) لتحليل هذه التمثيلات وربطها بالخصائص المعروفة للبروتينات، مثل الوظيفة الجزيئية أو الموقع الخلوي. أدى هذا التحليل إلى تفسيرات دقيقة باللغة البسيطة، مثل: "هذه العقدة تُشير إلى بروتينات مشاركة في نقل الأيونات أو الأحماض الأمينية عبر الغشاء الخلوي". النتائج أظهرت أن النماذج تُركز على ميزات حيوية مثل عائلات البروتينات والعمليات الأيضية والبنائية. هذا التفسير يُعد خطوة كبيرة نحو فهم ما تتعلمه النماذج، مما يمكن الباحثين من اختيار النموذج الأنسب لمهام معينة، أو تعديل المدخلات لتحسين النتائج. كما أن هذه الأدوات قد تُسهم يومًا في اكتشاف معرفة بيولوجية جديدة من خلال تحليل ما تُخزّنه النماذج، حتى في حالات لا يُمكن للعلماء تفسيرها حاليًا. كما يرى جورال أن هذه التقنية قد تفتح بابًا لفهم أعمق للبيولوجيا من خلال النماذج الذكية، خاصة مع تطورها المستمر. الدراسة دُعمت ماليًا من المعهد الوطني للصحة، ونُشرت في مجلة الأكاديمية الوطنية للعلوم.

Related Links