HyperAIHyperAI

Command Palette

Search for a command to run...

NVIDIA BioNeMo تستخدم التوازي السياقي لنمذجة الجزيئات الحيوية

كشفت مجموعة NVIDIA BioNeMo عن إطار عمل جديد للتماسك السياقي (Context Parallelism) يكسر الحواجز المتعلقة بالذاكرة في علم الأحياء البنيوي، مما يمكّن الباحثين من نمذجة الأنظمة البيولوجية الضخمة ككل دون الحاجة إلى تجزئتها. لطالما اضطر العلماء إلى تفكيك البروتينات المعقدة إلى أجزاء صغيرة لتتوافق مع ذاكرة كرت الشاشة الواحد، مما أدى إلى فقدان المعلومات البعيدة المدى الضرورية لفهم التفاعلات الوظيفية الكاملة. يوفر الحل الجديد إمكانية نمذجة مركبات تتجاوز آلاف الأحماض الأمينية دون التضحية بالدقة الهيكلية. يعمل الإطار الجديد بتقسيم نظام جزيئي واحد ضخم عبر وحدات معالجة رسومية متعددة بدلاً من تخصيص كل وحدة لمركب مختلف، وهو ما يختلف عن التوازي التقليدي للبيانات. تعتمد البنية التحتية على واجهات برمجة التطبيقات الموزعة من Torch لإدارة الاتصالات بين الوحدات، حيث يتم تقسيم المصفوفة العالمية للتفاعلات إلى كتل محلية، مما يقلل استهلاك الذاكرة لكل جهاز بشكل كبير. كما يدمج النظام الحساب المتزامن مع نقل البيانات، بحيث تقوم كل وحدة معالجة بحسابات محلية بينما تقوم في الوقت نفسه بتبادل البيانات مع الوحدات المجاورة في شبكتها، مما يحسن الكفاءة مع زيادة حجم المشكلة. أثبتت التقنية فعاليتها من خلال قدرة نموذج Boltz على التنبؤ ببنية نظام بيولوجي يتكون من 3,605 حمضًا أمينيًا عبر أربع سلاسل بروتينية، وهو حجم يتجاوز بكثير قدرة التدريب النموذجية وسعة ذاكرة وحدة المعالجة الواحدة. تم تحقيق هذا التنبؤ بدقة عالية في أقل من خمس دقائق باستخدام أربعة كروت NVIDIA H100، مع الحفاظ على جميع التفاعلات البعيدة المدى بين الوحدات الفرعية داخل نافذة السياق. هذا الإنجاز يفتح الباب أمام نمذجة مركبات بروتينية بحجم 20,000 رمز أو أكثر باستخدام مئات الوحدات المعالجة. تعتمد الشركات الناشئة والجهات البحثية الشريكة مثل Rezo Therapeutics وProxima وEarendil Labs هذا الإطار لتعزيز قدراتها في اكتشاف الأدوية. فقد ساعدت التقنية Rezo في التنبؤ بتفاعلات البروتين البروتيني التي تمتد إلى 6,500 حمض أميني، مما زاد من نسبة اكتشاف معقدات بروتينية جديدة عالية الجودة. بينما ساهمت Proxima في تمكين نموذجها التوليدي من حل التفاعلات العلاجية عبر الجينوم بأكمله، واعتمدت Earendil على التوسع في طول التسلسل لفهم أنظمة بروتينية متعددة كانت تعتبر سابقًا مكلفة حسابيًا. على الرغم من كسر الحواجز التقنية، يشدد الباحثون على أن القدرة الحسابية وحدها لا تضمن الدقة البيولوجية، حيث أن النماذج الحالية تحتاج إلى ضبط دقيق بمقاطع بيانات أكبر لفهم المنطق الناشئ للتفاعلات بعيدة المدى.为解决 مشكلة ندرة البيانات، تعمل NVIDIA على تطوير قاعدة بيانات بنية البروتين AlphaFold باستخدام برمجيات الحوسبة المسرعة لتوليد تنبؤات عالية الإنتاجية لمركبات كبيرة ومعقدة، مما سيوفر البيانات اللازمة لتدريب نماذج أساسية تمثل أنظمة بيولوجية أكبر وأكثر تعقيدًا في المستقبل.

الروابط ذات الصلة

NVIDIA BioNeMo تستخدم التوازي السياقي لنمذجة الجزيئات الحيوية | القصص الشائعة | HyperAI