ضبط النماذج البيولوجية الأساسية بلورا وصفات بايو نيمو
كشفت شركة إنفيديا عن مجموعة وصفات تدريب جديدة في منصة BioNeMo تتيح ضبط النماذج الأساسية للبيولوجيا الحسابية باستخدام تقنية التكيف منخفض الرتبة LoRA. يستهدف هذا الإصدار تسهيل تطبيق نماذج تتجاوز مليارات المعاملات على عتاد محدود، مثل محطة العمل المزودة ببطاقة RTX 6000 Blackwell. يعتمد النهج على تجميد الأوزان المدربة مسبقاً للهيكل الأساسي، وتدريس مصفوفات ذات رتبة منخفضة فقط، مما يقلص حجم المعاملات القابلة للتدريب إلى نحو واحد في المئة مع الحفاظ على دقة تنبؤ تنافسية. وتتكامل التقنية مع محرك المحولات TE من إنفيديا، وتنسيق ضغط التسلسلات THD الذي يرفع سرعة المعالجة بأكثر من خمسة أضعاف ويخفض استهلاك الذاكرة عبر استبعاد الرموز الزائدة غير المفيدة. أظهرت التطبيقات العملية فعالية المنهجية عبر وحدتين بيولوجيتين مختلفتين. في مهمة التنبؤ بالبنية الثانوية للبروتينات باستخدام نموذج ESM2-3B، سجل النظام دقة بلغت 84.80 بالمائة لمقياس Q3 و74.30 بالمائة لمقياس Q8، متساوياً أو متفوقاً على النماذج المرجعية المتخصصة، مع إتمام التدريب في أقل من ساعة على بطاقة واحدة. وفي سياق متوازٍ، طُبقت المنهجية على نموذج Evo2-1B لتصنيف مواقع الشقوق في الحمض النووي، حيث قفزت دقة الاختبار من 52.3 بالمائة باستخدام الرأس التصنيفي فقط إلى 96.6 بالمائة مع LoRA، مع تدريب 1.42 بالمائة فقط من المعاملات. توفر هذه الوصفات بيئات تدريب مبنية على PyTorch ومكتبات Hugging Face وMegatron-Bridge، مما يضمن تكاملاً سلساً بين بيئات التدريب الموزعة وأدوات التقييم المعيارية. تمثل هذه التطورات نقلة نوعية في جعل نماذج البيولوجيا الحاسوبية الضخمة قابلة للتخصيص على أجهزة المحطات العملية، مما يخفض العوائق التقنية والمالية أمام مختبرات الأبحاث والشركات الناشئة. تفتح هذه المنصة آفاقاً واسعة أمام تطبيقات الذكاء الاصطناعي الطبي والبيولوجي، مع ضمان كفاءة تشغيلية عالية وإتاحة جميع أكواد البرمجة للمستخدمين لتعديل النتائج أو إعادة إنتاجها حسب الحاجة.
