تأثير PCIe 5.0 على أداء بطاقة الرسوميات في تطبيقات إنشاء المحتوى
تأثير عرض النطاق الترددي لـ PCIe 5.0 على أداء وحدات معالجة الرسومات (GPU) في إنشاء المحتوى المقدمة مع إطلاق بطاقات الفيديو المستهلكة من نوع NVIDIA Blackwell وAMD Radeon 9000 بناءً على RDNA 4، أصبحنا أخيرًا نملك أجهزة تدعم معيار PCIe 5.0. رغم أن اللوحات الأم التي تدعم هذا المعيار موجودة منذ فترة، لم تكن هناك أجهزة تقنية أخرى تستفيد منه سوى وحدات التخزين. هذا الأمر يثير السؤال: ما هو تأثير زيادة عرض النطاق الترددي في PCIe 5.0 على أداء وحدات معالجة الرسومات في تطبيقات إنشاء المحتوى؟ تقنية PCI Express (PCIe) PCI Express هي تكنولوجيا تستخدم لتوصيل الأجهزة الداخلية في الكمبيوتر باللوحة الأم. تتكون من مقبس فعلي وطريقة اتصال بين الأجهزة. منذ عام 2003، شهدنا عدة مراجعات وتحديثات للمعيار. حاليًا، أكثر المواصفات شيوعًا في اللوحات الأم عالية الجودة الجديدة هي PCIe 5.0 بـ 16 مسارًا (x16)، لكن غالبًا ما تكون بعض المسارات بمعيار 4.0. الفرق الرئيسي بين إصدارات PCI Express هو معدل النقل. يتكون الاتصال بين الأجهزة من رقمين رئيسيين: عدد المسارات ونسخة PCIe. معظم الفتحات في اللوحة الأم تتراوح بين 4 و16 مسارًا (x4, x8, أو x16)، مع وجود فتحات نادرة بمسار واحد أو اثنين (x1 أو x2). كل مسار له معدل نقل أقصى يحدد بواسطة نسخة PCIe. منذ PCIe 3.0، تم ضعف معدل النقل في كل نسخة جديدة. مشكلة فتحات PCIe في اللوحات الأم الحديثة لمustrة الصعوبات الحالية في استخدام عدة أجهزة PCIe في اللوحات الأم المستهلكة الحديثة، قمنا بجمع بعض أفضل اللوحات الأم المبيعة على Newegg المتوافقة مع AM5 وLGA 1851، بالإضافة إلى اللوحات الأم المفضلة لدينا من ASUS ProArt. معظم هذه اللوحات ليست الأرخص المتاحة، لكنها أيضًا ليست الأغلى. يمكن القول إنها الأكثر شعبية لبناء أجهزة الكمبيوتر الجديدة. ما نلاحظه عند النظر إلى هذه اللوحات هو أن اللوحة الأم من ASUS TUF هي الوحيدة التي توفر أكثر من 3 فتحات توسع PCIe. من بين هذه الفتحات الثلاث، لا يوجد أي منها يتجاوز معيار 4.0 x4، باستثناء اللوحات الأم من ProArt. على العديد من اللوحات، يكون أحد هذه الفتحات الثلاث أبطأ، بمعدل 3.0 x1 أو x2. (ملاحظة: بينما تكون الفتحات غير الرئيسية بطول x16 جسديًا، غالبًا ما تكون موصولة كهربائيًا بـ x4 أو أقل). تقدم لوحة TUF خيارات متعددة من 4.0 x4 و4.0 x1، بينما يمكن للوحات ProArt العمل بـ x16 في الفتحتين العلويتين، مع تقييدهما إلى x8 عند استخدامهما معًا. بالطبع، ليس كل المستخدمين بحاجة إلى الكثير من البطاقات الإضافية. بالنسبة للكثير من المستخدمين، تكون وحدة معالجة الرسومات الواحدة هي الوحيدة التي سيستخدمونها. لكننا وجدنا أن المحترفين يحتاجون غالبًا إلى وحدة معالجة رسومات واحدة على الأقل وبطاقة إضافية واحدة. بناءً على ذلك، نعتقد أن العرض النطاقي الرئيسي الذي يجب التركيز عليه في النتائج القادمة هو 5.0 x16، 5.0 x8، و4.0 x4. بالنسبة لأولئك الذين يفكرون في ترقية وحدة معالجة الرسومات على لوحات أم قديمة، قد يكون معيار 3.0 x16 وx8 أيضًا ذا صلة. الاختبارات اخترنا مقاييس الأداء الخاصة بنا لتغطية العديد من العمليات والمهام لتوفير نظرة متوازنة حول التطبيق وتفاعلات الأجهزة. ومع ذلك، لدى العديد من المستخدمين عمليات عمل متخصصة. نظرًا لذلك، نحب تقديم نتائج فردية للمقاييس. إذا كانت منطقة محددة في التطبيق تشكل معظم عملك، ففحص هذه النتائج سيعطيك فهمًا أكثر دقة للاختلافات في الأداء بين المكونات. وإلا، نوصي بتجاوز هذا القسم والتركيز على تحليلنا التفصيلي في الأقسام التالية. تحرير الفيديو / الرسوم المتحركة: DaVinci Resolve Studio & After Effects في كل من DaVinci Resolve وAfter Effects، تضمنا فقط النقاط "الإجمالية" للأداء. هذا لأنه لم يكن هناك الكثير من الاختلافات في الاتجاهات العامة للأداء عندما فصلناها حسب العملية. ومع ذلك، يمكنك رؤية النقاط الخاصة بالعمليات المختلفة في جداول النتائج الأولية أعلاه، مثل الرسوم ثلاثية الأبعاد في After Effects أو الوسائط البينية في Resolve. بدءًا من DaVinci Resolve (الرسم البياني #1)، وجدنا أن عرض النطاق الترددي لـ GPU PCIe يؤثر بشكل واضح على الأداء الإجمالي. في أعلى سلم العرض النطاقي، نرى أداءً متشابهًا نسبيًا من PCIe 5.0 x16، 5.0 x8، و4.0 x16. فنيًا، نحن لدينا النتيجة لـ 5.0 x16 في المقدمة، لكنها ضمن الهامش المقبول للخطأ في هذا النوع من الاختبارات. بعد تلك الثلاثة، يأتي التجميع التالي وهو جميع معايير 16 جيجابايت/ثانية: 5.0 x4، 4.0 x8، و3.0 x16. هذا التجميع أداءه حوالي 90% من السابق. نحن لا نحب فقدان 10% من الأداء فقط بسبب وجود فتحة أبطأ، لكنه غالبًا ما يكون مقبولًا. ومع ذلك، فإن الطبقة التالية ليست كذلك. معايير 3.0 x8 و4.0 x4 كانت أسرع بنسبة 75% فقط من النتيجة الكاملة (5.0 x16). فيما يتعلق بأبطأ الخيار، 3.0 x4، كان أداءه 54% فقط من الأداء الكامل. بينما قد يكون تشغيل وحدة معالجة الرسومات بهذه المعايير نادرًا، نوصي بالتأكيد بالابتعاد عن تكوين وحدة معالجة الرسومات بهذه العروض النطاقية في DaVinci Resolve. نرى تأثيرًا أقل في After Effects (الرسم البياني #2). بصريًا، على عكس DaVinci Resolve، تختلف الأشرطة بشكل أقل حسب اللون، وهناك أقل خطوات تدرجية. الأبطأ ثلاثة معايير هي الأبطأ ثلاثة نتائج. هنا، تكون نتائج 64 جيجابايت/ثانية حتى 16 جيجابايت/ثانية جميعها ضمن الهامش المقبول للخطأ، وبالتالي فهي عشوائية. بمجرد خفض العرض النطاقي إلى 8 جيجابايت/ثانية مع 3.0 x8، نكون خارج هذا الهامش (لكن فقط بالنسبة للتجميع). عند 8 جيجابايت/ثانية، يكون 4.0 x4 أبطأ من النتائج ذات العرض النطاقي الأعلى. أخيرًا، يكون 3.0 x4 أبطأ بنسبة 10% من تكوينات 16 جيجابايت/ثانية أو أعلى. نوصي بقليل من القلق بشأن عرض النطاقي في After Effects، لكن يجب محاولة تجنب تكوينات العرض النطاقي المنخفض للغاية مثل 3.0 x4. تطوير الألعاب / الإنتاج الافتراضي: Unreal Engine نتائج اختبارنا في Unreal Engine تقع بين DaVinci Resolve وAfter Effects. كما في DaVinci Resolve، هناك تجميع واضح للمعاير، لكن كما في After Effects، لا توجد خطوات تدرجية كثيرة. تكون معايير 5.0 x16، x8، وx4، بالإضافة إلى 4.0 x16 وx8، و3.0 x16 جميعها متطابقة تقريبًا. يبدو أن 3.0 x16 قد تكون أبطأ قليلاً من الباقي، لكنها ضمن الهامش المقبول للخطأ في الاختبارات. ومع ذلك، نرى نتائج خارج هذا الهامش لمعاير العرض النطاقي المنخفض. يكون 4.0 x4 و3.0 x8 أسرع بنسبة 93% من نتائج 64 جيجابايت/ثانية، ويكون 3.0 x4 في المؤخرة، بفأرة 90% من الأداء. بشكل عام، ليست هذه اختلافات كبيرة في الأداء. كما ناقشنا سابقًا، بينما لا يمثل فقدان 10% من الأداء شيئًا جيدًا، فهو أيضًا مقبول في بعض الحالات. نشجع الحذر عند خفض وحدة معالجة الرسومات إلى 4.0 x4 أو أقل، لكن قد يكون هذا التنازل قابلًا للتقدير في تكوينات وحدات معالجة الرسومات المتعددة أو لتسهيل استخدام البطاقات الإضافية. التصوير باستخدام GPU: Blender & Octane لهذه المقالة، قمنا بالاختبار باستخدام ثلاثة مقاييس للتصوير: V-Ray، Blender، وOctane. ولكن، بدا أن نتائج V-Ray كانت غريبة بشكل خاص، لذلك لم نشملها في الرسوم البيانية، رغم أنها موجودة في جدول النتائج الأولية. في Blender وOctane، لم نر أي تأثير لعرض النطاق الترددي على الأداء. في حالة Blender، كان التغيير الكلي من المتوسط حوالي 5%، بينما كان Octane 2.5%. جميع النتائج تقريبًا ضمن الهامش المقبول للخطأ، ولا يمكننا استخلاص الكثير من الاستنتاجات. في هذه الحالة، يعني ذلك أن هناك ربما لا يوجد تأثير. هذا ينطوي على منطق لأن المشاهد كلها تحتوي داخل ذاكرة وحدة معالجة الرسومات، ولا يتم حساب وقت التحميل. بشكل عام، يبدو أن هناك قليلًا أو لا يوجد سلبيات من تركيب وحدة معالجة الرسومات في تكوين عرض نطاق ترددي منخفض للتطبيقات التي تقوم بالتصوير خارج الخط. الذكاء الاصطناعي: LLM (llama) أخيرًا، يبحث مقياس Llama.cpp في أداء وحدة معالجة الرسومات في معالجة الدفعات وgeneration tokens. بالنسبة لكلتا العمليتين، تبدو النتائج فعالة عشوائية، بدون أي نمط واضح. الفرق الإجمالي في الأداء أيضًا صغير نسبيًا، حوالي 6% لمعالجة الدفعات. نظرًا لذلك، نقوم عادةً بالقول إن عرض النطاق الترددي له تأثير قليل على أداء الذكاء الاصطناعي. ولكن، نحذّر من أن مقياس LLM الخاص بنا صغير جدًا، وأن تكوينات LLM غالبًا ما تشمل وحدات معالجة رسومات متعددة تقوم بتفريغ بعض النموذج إلى ذاكرة النظام. في أي من هذين الحالتين، نتوقع أن يكون لعرض النطاق الترددي تأثير كبير على الأداء الإجمالي. الاستنتاجات في اللوحات الأم الحديثة، غالبًا ما تحصل على فتحة واحدة فقط بعرض نطاق ترددي كامل 5.0 x16. قد تكون الفتحات الإضافية بمعيار 5.0 x8، لكنها غالبًا ما تكون أقل بكثير، بمعيار 4.0 x4 أو أقل. نتيجة لذلك، قد تجد تكوينات تعمل بوحدات معالجة رسومات متعددة أو بطاقات إضافية حيث يكون العرض النطاقي لواحدة أو أكثر من وحدات معالجة الرسومات مخفضًا بشكل كبير. رغم أن معظم العمليات التي اختبرناها لا تظهر فقدانًا كبيرًا في الأداء عند 4.0 x4، هذا ليس صحيحًا دائمًا. في تحرير الفيديو والرسوم المتحركة، رأينا أكبر تأثير. كانت معايير 5.0 x16، x8، و4.0 x16 متطابقة تقريبًا. ولكن، أدناه، بدأنا في رؤية بعض الاختلافات، خاصة في DaVinci Resolve. في هذا التطبيق، كان 3.0 x16 أبطأ بنسبة 10%,وكان 4.0 x4، وهو السيناريو الأكثر شيوعًا، أبطأ بنسبة حوالي 25%. هذه الهوامش مخففة في After Effects، لكنها لا تزال موجودة. نوصي بالحذر عند تكوين نظام لتطبيقات تحرير الفيديو مع بطاقات إضافية متعددة، حيث يمكن أن يكون لتخفيض عدد المسارات المتاحة لوحدة معالجة الرسومات تأثير قابل للقياس على الأداء. مقياس Unreal Engine أيضًا أظهر تأثيرات على الأداء من عرض النطاق الترددي لـ PCIe. ومع ذلك، كانت هذه التأثيرات أقل حدة. نرى فقط انخفاضًا ملحوظًا بمجرد خفض العرض النطاقي إلى 4.0 x4 (أو ما يعادله)، بمتوسط انخفاض في الإطارات في الثانية بنسبة 7%. كان 3.0 x4 أسوأ قليلاً، ببطء بنسبة 10% مقارنة بعرض النطاق الترددي الأقصى. بينما نقليل قلقنا بشأن هذا القدر من فقدان الأداء، يجب أخذه في الاعتبار. في التطبيقات التي تقوم بالتصوير خارج الخط وLMMs، لم يظهر أي تأثير لعرض النطاق الترددي على الأداء. هذا منطقي حيث تميل هذه التطبيقات إلى تحميل عملها بشكل كامل في ذاكرة وحدة معالجة الرسومات وتفشل إذا لم تستطع. هناك بعض الاستثناءات مع LMMS، لكن العمل من ذاكرة النظام يسبب تباطؤًا كبيرًا. وبالتالي، بينما يمكن أن يبطئ عرض النطاق الترددي المنخفض تحميل النموذج أو المشهد الأولي، يجب أن يكون له تأثير قليل جدًا على الأداء بعد ذلك. لاحظنا فقط أن في حالات استخدام ذاكرة وحدة معالجة الرسومات المشتركة لتناسب النموذج، قد يكون لعرض النطاق الترددي تأثير كبير. لم نتمكن من اختبار ذلك هنا. عندما نقوم بتكوين الأنظمة التي نبيعها، نوازن بين الحاجة إلى أداء قصوى من المكونات والرغبة في بطاقات إضافية ضرورية لعمل عملائنا. غالبًا ما يعني هذا تقليل وحدة معالجة الرسومات الرئيسية إلى PCIe 5.0 x8، مما يقلل من العرض النطاقي إلى النصف. ومع ذلك، كما أظهرنا في هذه المقالة، غالبًا ما يكون لهذا التقليل الكبير في العرض النطاقي تأثير ضئيل على الأداء الحقيقي. خارج بعض الحالات غير الشائعة، تؤكد هذه الاختبارات أنه طالما لديك لوحة أم حديثة تدعم PCIe 5.0، فإن تشغيل وحدة معالجة الرسومات بسرعة x8 ليس مشكلة. ومع ذلك، قد تؤدي اللوحات الأم الأقل جودة، والتي ستتطلب تشغيل وحدة معالجة الرسومات بمعيار 4.0 x4، إلى عقوبات في الأداء. تقييم الحدث من قبل المختصين وفقًا للمتخصصين في مجال تكنولوجيا المعلومات، تعتبر زيادة عرض النطاق الترددي في PCIe 5.0 خطوة مهمة نحو تحسين الأداء، خاصة في تطبيقات تحرير الفيديو والرسوم المتحركة. ومع ذلك، فإن التأثير في تطبيقات أخرى مثل التصوير باستخدام GPU والذكاء الاصطناعي يبدو محدودًا. هذا يشير إلى أن التحديث إلى PCIe 5.0 سيكون أكثر فائدة للمحترفين الذين يعملون في تحرير الفيديو والرسوم المتحركة وليس اللاعبين أو المستخدمين العاديين. نبذة عن الشركة ذات الصلة ASUS هي شركة رائدة في مجال تصنيع اللوحات الأم وأجهزة الكمبيوتر. تتميز لوحاتها الأم ProArt بتصميمها الممتاز ودعمها العالي لفتحات PCIe، مما يجعلها الخيار المفضل لمحترفي إنشاء المحتوى الذين يحتاجون إلى أداء عالٍ وقابلية توسيع جيدة.