HyperAIHyperAI

Command Palette

Search for a command to run...

نيرو أوتو موديل يسرع ضبط نماذج ترانسفورمرز

أطلقت إنفيديا مكتبة NeMo AutoModel المفتوحة المصدر، التي تندمج بسلاسة مع أحدث إصدار من مكتبة HuggingFace Transformers للإصدار الخامس، لتمكين مطوري الذكاء الاصطناعي من ضبط نماذج المزيج من الخبراء بسرعة وكفاءة غير مسبوقة. يأتي هذا التكامل استجابةً للطلب المتزايد على البنى التحتية المتطورة التي تدعم النماذج الهجينة الحديثة، مع الحفاظ على توافق تام مع واجهات برمجة التطبيقات الحالية داخل النظام البيئي للمصادر المفتوحة. تعتمد المكتبة على ميزات الإصدار الخامس من Transformers، مثل تحميل الأوزان الديناميكي والخلفيات المتخصصة، لتعزيزها بمحركات متقدمة تضمن تسريع عمليات الضبط الدقيق بنسبة تتراوح بين 3.4 و3.7 مرة مقارنة بأفضل تهيئة للإصدار الأصلي. في الوقت نفسه، تنجح NeMo AutoModel في خفض استهلاك الذاكرة الرسومية بنسبة تتراوح بين 29 و32 في المئة. وقد أظهرت الاختبارات المعملية على عتاد NVIDIA H100 قدرة المكتبة على دعم التدريب الكامل لنموذج ضخم يتجاوز 550 مليار معلمة عبر عقد متعددة، وهو نطاق كان يستنفد موارد مكتبة Transformers القياسية بالكامل. يعود هذا التحسن الكبير في الأداء إلى دمج ثلاث تقنيات جوهرية: توازي الخبراء الذي يوزع أوزان الخبراء عبر وحدات معالجة الرسومات المتعددة مما يخفف الضغط على الذاكرة بشكل كبير، وتقنية DeepEP التي تدمج عمليات توجيه الرموز مع الحسابات في نوى رسومية موحدة لتجاوز الاختناقات الشبكية، ونوى TransformerEngine التي تسرع العمليات الأساسية مثل الانتباه والطبقات الخطية. وتعمل هذه المكونات بالتزامن مع نظام تحميل الأوزان الديناميكي من إنفيديا، الذي يحول تنسيقات النماذج تلقائياً أثناء التحميل دون المساس ببنية الملفات القياسية أو تعقيد سير العمل. يتميز الحل بتبسيطه الشديد للعملية؛ حيث يكفي المطور تغيير سطر استيراد واحد في الكود لبدء الاستفادة من التحسينات، دون الحاجة لإعادة كتابة أي جزء من منطق التدريب. تظل النماذج المدربة بحفظها بتنسيق HuggingFace القياسي، مما يضمن تشغيلها بسلاسة على بيئات الاستدلال الشهيرة مثل vLLM وSGLang. تأتي هذه الإضافة كخطوة استراتيجية لتعميق التكامل بين مجتمع المصادر المفتوحة وإنفيديا، مع إتاحة الكود ونماذج الضبط وبيانات المقارنة على مستودع NeMo AutoModel الرسمي للاعتماد الفوري من قبل الباحثين والمطورين.

الروابط ذات الصلة