HyperAIHyperAI

Command Palette

Search for a command to run...

أداة ذكاء اصطناعي مفتوحة المصدر تُسرّع أداء نماذج اللغة والتصوير التوليدي على أجهزة NVIDIA RTX

في مؤتمر CES 2026، كشفت NVIDIA عن تحسينات كبيرة في أداء النماذج الذكية الاصطناعية على أجهزة الكمبيوتر المجهزة بمعالجات RTX، مما يعزز قدرة المطورين على تشغيل نماذج لغة صغيرة (SLMs) ونماذج التمايز (Diffusion) بشكل محلي بكفاءة أعلى. مع نمو حركة التطوير على أجهزة PC بشكل متسارع، أصبحت أدوات مثل ComfyUI، llama.cpp، Ollama، وUnsloth أكثر شيوعًا، حيث زاد عدد المطورين الذين يستخدمون النماذج على أجهزة PC عشرة أضعاف خلال عام واحد. أبرز التحديثات تشمل تسريع الأداء في تشغيل النماذج عبر إطار عمل مفتوح المصدر. على صعيد نماذج التمايز، تم تحسين أداء ComfyUI على معالجات NVIDIA باستخدام PyTorch-CUDA، مع دعم تنسيقات التقليل الكمي NVFP4 وFP8، التي تقلل من استهلاك الذاكرة بنسبة 60% و40% على التوالي، وتوفر تسريعًا متوسطًا بنسبة 3x مع NVFP4 و2x مع FP8. تم إتاحة الكود المصدري للتحسينات في مستودع ComfyUI Kitchen، بينما أصبحت نقاط التحقق (checkpoints) المُقلَّلة للحجم متاحة على HuggingFace، بما في ذلك نماذج حديثة مثل LTX-2، FLUX.2، Qwen-Image، وZ-Image. في مجال النماذج اللغوية الصغيرة، سجلت llama.cpp وOllama تحسنًا في أداء إنتاجية الرموز (token generation) بنسبة 35% و30% على أجهزة RTX، على التوالي، خاصة مع نماذج Mixture-of-Experts. تضمنت التحسينات دعم عينة الرموز على GPU، وتدوير تدفقات CUDA لتسريع الاستدلال، وتحسينات في نواة MMVQ لتعظيم استخدام GPU، وتسريع تحميل النماذج بنسبة تصل إلى 65% على أجهزة DGX Spark. كما أُعلن عن دعم مُدمج لـ NVFP4 على معالجات Blackwell، مما يُسرّع معالجة المطالبات بنسبة 25%. أُطلقت نماذج صوتية-مرئية متقدمة بفضل شراكة NVIDIA مع Lightricks، حيث تم إصدار نموذج LTX-2 المفتوح، القادر على إنتاج محتوى صوتي-مرئي متماسك بجودة 4K و50 إطارًا في الثانية، مع دعم التحكم متعدد الوسائط. يُقلل النموذج المُقلَّل من الذاكرة بنسبة 30%، ويُمكن تشغيله بكفاءة على أجهزة RTX وDGX Spark. لتعزيز بناء الوكلاء الذكية المحلية (Agentic AI)، أطلقت NVIDIA نموذج Nemotron 3 Nano، نموذجًا مُختصرًا بـ 32 مليار معلمة، يُستخدم بكفاءة في المهام المتعددة مثل البرمجة والتفكير الطويل، مع دعم تدريب مخصص (LoRA) وتكامل مع Ollama وllama.cpp وUnsloth. كما تعاونت NVIDIA مع Docling، أداة لتحليل المستندات وتحويلها إلى لغة قابلة للفهم الآلي، مع تسريع أداءها أربع مرات مقارنة بالمعالجات التقليدية، ودعم نموذجين: تقليدي باستخدام OCR ومتقدم باستخدام نماذج رؤية حاسوبية (VLM). أيضًا، أُحدثت مكتبات NVIDIA لتأثيرات الصوت والفيديو، حيث تم تحسين ميزة إضاءة الفيديو الاصطناعية لتكون أكثر طبيعية وثباتًا، مع تقليل استهلاك GPU بنسبة 3x وحجم النموذج بنسبة 6x، ما يسمح بتشغيلها على أجهزة RTX 3060 فما فوق. تُظهر الإصدار الجديد من تطبيق NVIDIA Broadcast هذه الميزة في العمل. بفضل هذه التحديثات، أصبح بناء تطبيقات الذكاء الاصطناعي المحلية أكثر كفاءة، مع دعم مفتوح، وتحسينات أداء حقيقية، وتمكين المطورين من بناء حلول متطورة مباشرة على أجهزتهم.

الروابط ذات الصلة