HyperAI
Back to Headlines

بطاقات GPU NVIDIA RTX Blackwell تسرع في تحرير الفيديو الاحترافي وتقدم نماذج AI للكلام بدقة وأداء قياديين في الصناعة، إلى جانب تقديم تعريف حول نقاط العوملة 8 كوسيلة لتدريب AI بكفاءة وبدقة أقل.

منذ 2 أشهر

كاميرات 4:2:2 وأدوات الذكاء الاصطناعي للتحرير الملخص الرئيسي باتت كاميرات 4:2:2 متاحة على نطاق واسع للمستهلكين بعد أن كانت محصورة في الاستخدام المهني بسبب تكلفتها العالية. هذه الكاميرات قادرة على التقاط ضعف المعلومات اللونية مقارنة بالكاميرات القياسية، مع زيادة طفيفة في حجم الملفات بنسبة ٣٠٪ فقط. ومع انخفاض الأسعار، أصبح لدى المبدعين خيارات أكثر بكثير بأسعار أقل للدخول. تشمل بطاقات NVIDIA RTX الجديدة القائمة على هندسة NVIDIA Blackwell مكونات مخصصة لرمز وفك رمز الفيديو 4:2:2، بالإضافة إلى الجيل الخامس من النوى المتوازية (Tensor Cores) المصممة لتسرع عمليات الذكاء الاصطناعي والتعلم العميق. تقدم سلسلة GeForce RTX 50 وسلسلة NVIDIA RTX PRO Blackwell القدرة على تشغيل نماذج الذكاء الاصطناعي المولدة بسرعة وفعالية، مما يتيح أدوات جديدة وعمليات عمل مبتكرة. تواجه كاميرات 4:2:2 تحديات في تشغيل الفيديو بسبب الحاجة إلى قوة حوسبة أعلى، مما يؤدي إلى تقطيع في البث. لذلك، كان على العديد من المحررين إنشاء نماذج بديلة قبل التحرير، وهو عملية مرهقة تتطلب تخزينًا إضافيًا وتقلل من الدقة أثناء التحرير. ومع ذلك، تقدم بطاقات RTX 50 سرعة ترميز 10 ضعف للفيديو 4:2:2 وقدرة فك الرمز تصل إلى 8K بمعدل ٧٥ إطارًا في الثانية. تطبيقات التحرير الأكثر شهرة، بما في ذلك DaVinci Resolve وCapCut وWondershare Filmora، تدعم تسريع الحوسبة من خلال بطاقات NVIDIA. تسمح دقة 10-بت 4:2:2 للمحررين بالحصول على تمثيلات لونية أكثر دقة ونتائج تدرج لوني أفضل. البيانات اللونية الإضافية تزيد من المرونة أثناء تصحيح الألوان وتتيح استخراجًا أوضح وأكثر دقة للأجسام من الخلفية، بالإضافة إلى حواف أكثر حدة للأجسام الصغيرة. الرسالة السياقية يعد استقرار سلسلة GeForce RTX 50 وNVIDIA RTX PRO Blackwell بمثابة خطوة كبيرة نحو تلبية الطلب المتزايد على التقنيات عالية الدقة والفعالة من حيث الحوسبة. هذه البطاقات توفر قدرات كبيرة للتحرير والإنتاج السينمائي، مما يجعلها الخيار الأمثل للمبدعين المحترفين والهواة على حد سواء. تعليقات الخبراء تشير إلى أن هذه التقنيات ستغير الطريقة التي يتم بها إنتاج وتحرير الفيديو، مع تقليل وقت العمل وتحسين جودة النتائج بشكل كبير. التعلم العميق بدقة FP8 الملخص الرئيسي مع نمو نماذج اللغات الكبيرة (LLMs)، تقدم NVIDIA حلولاً مبتكرة للتحصيص الدقيق للبيانات من أجل تحسين كفاءة التعلم العميق. تضمنت هذه الحلول تقنيات التحصيص المختلط مثل FP8، التي تعتمد على تنسيقات رقمية أكثر تخصصًا ودقيقة للتعامل مع متطلبات مختلف مراحل التعلم العميق. تتيح تقنية FP8 تحقيق سرعة وكفاءة أكبر في التعلم العميق دون فقدان كبير في الدقة. تتضمن هذه التقنية تنسيقين رئيسيين هما E4M3 وE5M2، كل منها يتميز بقدرات مختلفة في تمثيل البيانات. تدعم بطاقات NVIDIA H100 معمارية FP8 الجديدة، مما يتيح استخدام التحصيص الدقيق في الحوسبة وتخزين الذاكرة. تتفوق تنسيقات FP8 على تنسيقات الأعداد الصحيحة مثل INT8 في التعامل مع النطاق الديناميكي الواسع للوزن والتفعيلات والتدرجات في نماذج الشبكات العصبية العميقة. هذا النطاق الواسع يتطلب تحصيصًا دقيقًا لكل رقم، وهو ما توفره FP8 من خلال المantissa والexponent. في المقابل، تنسيقات INT8 الثابتة تتطلب عوامل تحصيص محددة مسبقًا قد لا تتناسب مع النطاق الديناميكي المتقلب. مع معمارية NVIDIA Blackwell، تم تقديم تنسيقات تحصيص دقيقة تحت FP8، مثل FP4 وFP6، بالإضافة إلى تحسينات في FP8. يختلف التحصيص بين(tensor scaling) و(block scaling)، حيث يحدد التحصيص لكل tenor عامل تحصيص واحد بينما يقسم التحصيص الأكثر دقة الملفات إلى كتل ويحدد عامل تحصيص لكل كتلة. تقنية التحصيص المتأخرة (delayed scaling) والتحصيص الحالي لكل tenor (per-tensor current scaling) تقدمان استراتيجيات مختلفة لتحقيق التوازن بين الأداء والدقة. بينما يحتفظ التحصيص المتأخر بسجل لأقصى قيمة مطلقة (amax) خلال التدريب، يتفاعل التحصيص الحالي مع نطاق البيانات الحالي بشكل فوري، مما يساعد على تحسين التقارب. الرسالة السياقية تقدم NVIDIA حلولًا مبتكرة في مجال التعلم العميق، مما يجعل التحصيص الدقيق مثل FP8 ممكنًا وفعالًا. هذه التقنيات تحقق توازنًا بين السرعة وكفاءة الذاكرة والدقة، مما يتيح فرصًا كبيرة للمطورين والمهتمين بتحسين أداء نماذجهم. يمكن للمطورين الاستفادة من هذه التقنيات عبر NVIDIA Transformer Engine، الذي يوفر أدوات متقدمة لإدارة التحصيص وتحسين الأداء. NVIDIA في مجال الذكاء الاصطناعي للاعتراف الصوتي الملخص الرئيسي تسعى NVIDIA إلى تحقيق أعلى مستويات الأداء والكفاءة والوصول في مجال الذكاء الاصطناعي للكلام واللغات، مما يفتح الباب أمام ابتكارات جديدة في مجال الاعتراف الصوتي الآلي (ASR). يعد NVIDIA Parakeet TDT 0.6B v2 أحد أبرز النماذج في هذا المجال، حيث يتميز بأفضل معدل خطأ لكلمات (WER) في الصناعة بنسبة ٦.٠٥٪، وأداء استدلال سريع للغاية (RTFx ٣٣٨٦.٠٢، أو ٥٠ ضعف أسرع من البدائل). يشمل NVIDIA Parakeet v2 ميزات مبتكرة مثل التوقيت الدقيق لكلمات وتحويل الأغاني إلى كلمات. هذه النماذج مفتوحة المصدر ومتوفرة للاستخدام التجاري. كما تقدم NVIDIA نماذج NeMo Canary، التي تتصدر قائمة Hugging Face للاعتراف الصوتي الآلي بفضل أدائها القوي في التعرف على الكلام والتترجم في عدة لغات. تتضمن هذه النماذج ميزات متقدمة مثل معالجة الضوضاء وإضافة علامات الترقيم، مما يجعلها مناسبة لتطبيقات متعددة اللغات وبيئات الصوت الصاخبة مثل المستشفيات والمطارات. تقدم NVIDIA أيضًا خدمات متكاملة للاعتراف الصوتي عبر NVIDIA Riva، وهي منصة مخصصة للخدمات الدقيقة للاعتراف بالكلام والترجمة. الرسالة السياقية باتت نماذج NVIDIA Parakeet وNeMo Canary الخيار الأمثل للمطورين الذين يبحثون عن دقة وسرعة وأداء متقدم في مجال الاعتراف الصوتي الآلي. هذه النماذج تقدم تغطية عالمية للغات ومعالجة فعالة للضوضاء، مما يجعلها مناسبة لتطبيقات الشركات ودعم العملاء وتطوير تطبيقات الوسائط المتعددة الجديدة. تعليقات الخبراء تؤكد أن هذه التقنيات تغير قواعد اللعبة في مجال الاعتراف الصوتي، مع تحسين كبير في الجودة والأداء.

Related Links