إطلاق CUDA 13.2 بميزات Python وتعزيز دعم الأنماط
أطلقت شركة إنفيديا إصدار النسخة 13.2 من منصة التطوير CUDA، محققة قفزة نوعية في دعم المعالجات الرسومية الحديثة وتعزيز إنتاجية المطورين عبر لغات البرمجة المختلفة. يأتي هذا التحديث لدعم نموذج "CUDA Tile" على معماريات الأجهزة من فئة 8.X وما بعدها، بما في ذلك شرائح Ampere وAda وBlackwell، مع إطلاق خطط لتشمل جميع معماريات Ampere فصاعداً في إصدارات قادمة من الأدوات. في الجانب المتعلق ببايثون، شهدت المكتبات توسعاً ملحوظاً مع إضافة أدوات جديدة لقياس الأداء (Profiling) وتصحيح الأخطاء في نوى Numba مباشرة من داخل البيئة البرمجية، مما يسهل على المطورين تشخيص المشاكل دون الحاجة للانتقال إلى أدوات معقدة. كما أضافت المكتبة دعمًا لنواة Nsight Python التي تتيح فحص أداء النوى بدقة عالية، بالإضافة إلى تحسينات في إدارة الذاكرة مثل وظائف cudaMemcpyWithAttributesAsync التي تتيح تحكمًا أدق في نقل البيانات دون الحاجة لواجهات معقدة، وتقليل استهلاك الذاكرة المحلية على أنظمة ويندوز. أحد التغييرات الجوهرية في هذه النسخة هو الانتقال التلقائي لسائقين العرض على أنظمة ويندوز إلى وضع MCDM بدلاً من TCC لتحسين التوافق مع ميزات النظام، مع بقاء خيار TCC متاحًا يدويًا للمستخدمين الذين يحتاجونه حاليًا. كما تم تقديم متغير بيئي جديد CUDA_DISABLE_PERF_BOOST يسمح بتعطيل رفع أداء المعالج تلقائيًا لتوفير الطاقة، وهو مفيد خاصة عند استخدام ميزات مثل التشفير والترميز عبر NVENC/NVDEC. فيما يتعلق بالمكتبات الرياضية، قدمت النسخة 13.2 تحسينات كبيرة في مكتبات cuBLAS وcuSOLVER. ففي cuBLAS، تم إضافة دعم تجريبي لنماذج MXFP8 على شرائح Blackwell باستخدام عمليات GEMM المجمعة، مما يحقق تسريعاً يصل إلى 4 أضعاف في حالات العمل المعقدة. أما في cuSOLVER، فقد تم تمكين الحسابات المُحاكاة بدقة FP64، مما يوفر مكاسب أداء تصل إلى ضعف الحجم في عمليات تحليل المصفوفات الكبيرة على وحدات معالجة الرسومات من الجيل الجديد. من الجوانب الأداة التطويرية، تم دمج Numba مع أدوات التصحيح المباشرة مثل CUDA-GDB وNsight لبيئة VS Code، مما يسمح بوضع نقاط توقف ومراقبة حالة البرنامج أثناء التنفيذ. كما تم تحديث Nsight Compute وNsight Systems بميزات جديدة لتحليل البيانات وربط النتائج، وإصدار مساعد برمجي ذكي مدفوع بالذكاء الاصطناعي مجانًا لمستخدمي حساب المطورين. أخيرًا، شهدت مكتبة CCCL إطلاق إصدار 3.2 مع واجهات برمجية حديثة تعتمد على C++، ومجموعة خوارزميات جديدة مثل "Top-K" لاختيار أكبر القيم دون فرز كامل، وخوارزميات اختزال القطع الثابتة التي توفر تسريعاً كبيراً في المعالجة. كما توسع دعم بايثون ليشمل مكتبات CuPy وML-Dtypes، مع تحسين التوافق بين الإطارات المختلفة مثل PyTorch وJAX، مما يجعل بيئة التطوير أسرع وأكثر سلاسة لبرمجة الذكاء الاصطناعي والحوسبة المتوازية.
