HyperAI
Back to Headlines

L'Impact de la Bande Passante PCIe 5.0 sur les Performances des GPU en Création de Contenu

il y a 2 jours

Impact du débit PCIe 5.0 sur les performances des GPU dans les applications de création de contenu Introduction Avec la sortie des GPU NVIDIA Blackwell et des GPU Radeon 9000 de la série RDNA 4, nous disposons enfin de cartes graphiques grand public compatibles avec la norme PCIe 5.0. Bien que les cartes mères supportant cette norme existent depuis un certain temps, jusqu'à présent, seules les solutions de stockage en profitaient vraiment. Cela soulève donc une question cruciale : quel est l'impact du débit élevé de PCIe 5.0 sur les performances des GPU dans les applications de création de contenu ? Comprendre PCI Express (PCIe) PCI Express (abréugié PCIe ou PCI-e) est une technologie connectant diverses périphériques internes d'un ordinateur à la carte mère. Les connecteurs physiques et les protocoles de communication sont utilisés pour les SSD, les GPU et les cartes additionnelles comme les RAID, les HBA et les cartes réseau. Depuis 2003, le standard PCIe a subi plusieurs révisions et mises à jour. Aujourd'hui, la spécification la plus couramment trouvée sur les cartes mères haut de gamme est PCIe 5.0 à 16x, même si certaines cartes mères proposent encore des voies PCIe 4.0. La principale différence entre les versions de PCI Express réside dans le taux de transfert. Une connexion PCIe se définit par deux caractéristiques : le nombre de voies et la version de PCIe. La plupart des slots sur une carte mère ont entre quatre et seize voies (x4, x8 ou x16), avec quelques autres à x1 ou x2. Chaque voie a un taux de transfert maximal défini par la version de PCIe. Depuis PCIe 3.0, chaque nouvelle version a doublé ce taux de transfert. Par exemple, PCIe 5.0 supporte jusqu'à 32 GT/s par voie. Ainsi, un slot x16 peut atteindre un débit maximal de 64 GB/s. Si ce même slot utilisait PCIe 4.0, il pourrait atteindre 32 GB/s avec 16 voies. Alternativement, 32 GB/s peuvent être atteints avec 8 voies en PCIe 5.0. Le problème des slots PCIe sur les cartes mères grand public Pour illustrer les difficultés actuelles liées à l'utilisation de plusieurs périphériques PCIe sur des cartes mères grand public, nous avons examiné plusieurs des cartes mères les plus vendues sur Newegg, compatibles avec les sockets AM5 et LGA 1851, ainsi que nos cartes mères préférées ASUS ProArt X870 et Z890 Creator. Nous remarquons immédiatement que, hormis la carte mère ASUS TUF, aucune de ces cartes mères ne dispose de plus de trois slots PCIe d'expansion. Parmi ces trois slots, aucun n'est autre chose qu'un x4 PCIe 4.0, à l'exception des cartes mères ProArt. Sur de nombreuses cartes mères, l'un de ces trois slots est même plus lent, à x1 ou x2 en PCIe 3.0. (Notez que, bien qu'ils soient physiquement de longueur x16, la plupart des slots secondaires sont câblés électriquement pour x4 ou moins). La carte mère TUF offre une variété de slots x4 et x1 en PCIe 4.0, tandis que les cartes mères ProArt peuvent utiliser x16 dans les deux premiers slots, chacun limité à x8 lorsqu'ils sont tous deux en usage. Bien que tous les utilisateurs n'aient pas besoin de nombreuses cartes additionnelles, nous avons constaté que les professionnels nécessitent souvent un GPU plus au moins une carte additionnelle. Par conséquent, nous pensons que les bandes passantes principales à surveiller dans les résultats à venir sont 5.0 x16, 5.0 x8, et 4.0 x4. Pour ceux qui envisagent une mise à niveau de GPU sur des cartes mères plus anciennes, 3.0 x16 et x8 sont également pertinentes. Testing Nous avons choisi nos benchmarks pour couvrir de nombreux flux de travail et tâches, offrant ainsi un aperçu équilibré des interactions logicielles et matérielles. Cependant, beaucoup d'utilisateurs ont des flux de travail spécialisés. Reconnaissant cela, nous avons également fourni des résultats individuels pour chaque benchmark. Si une zone spécifique d'une application constitue la majorité de votre travail, l'examen de ces résultats vous donnera une meilleure compréhension des disparités de performance entre les composants. Sinon, concentrez-vous sur notre analyse approfondie dans les sections suivantes. Édition vidéo / Graphismes en mouvement : DaVinci Resolve Studio & After Effects Dans DaVinci Resolve et After Effects, nous ne présentons que les scores "Globaux". Cela est dû à l'absence de différences significatives dans les tendances globales de performance lorsque nous les séparons par type de flux de travail. Toutefois, les tables de résultats bruts sont disponibles ci-dessus. Dans DaVinci Resolve (Graphique #1), nous avons constaté que la bande passante PCIe du GPU influence clairement les performances globales. Au sommet du spectre de bande passante, la performance de 5.0 x16, 5.0 x8 et 4.0 x16 est similaire. Les combinaisons de 16 G/s (5.0 x4, 4.0 x8 et 3.0 x16) sont environ 90% aussi performantes. Nous ne sommes pas enthousiasmés par une réduction de 10% de la performance due à des slots plus lents, mais c'est souvent acceptable. Cependant, la prochaine catégorie est problématique. 3.0 x8 et 4.0 x4 ne sont que 75% aussi rapides que les résultats à pleine bande passante (5.0 x16). La configuration la plus lente, 3.0 x4, n'atteint que 54% de la performance. Bien que ces combinaisons soient rares, nous recommandons fortement d'éviter de configurer un GPU à ces baisses de bande passante pour DaVinci Resolve. Dans After Effects (Graphique #2), l'effet global de la bande passante PCIe est moindre. Visuellement, contrairement à DaVinci Resolve, les barres ne sont pas regroupées par couleur, et il n'y a pas de schéma en escalier distinct. Les trois configurations de bande passante les plus basses sont également les trois résultats les plus lents. Ici, les résultats pour 64 G/s à 16 G/s sont tous dans la marge d'erreur, essentiellement aléatoires. Une fois que la bande passante est réduite à 8 G/s avec 3.0 x8, nous sortons de cette marge (bien que ce soit seulement par rapport au groupe). À 8 G/s, 4.0 x4 est plus lent que les configurations à plus haute bande passante. Enfin, 3.0 x4 est 10% plus lent que les configurations à 16 G/s ou plus. Nous recommandons de se soucier moins de la bande passante PCIe dans After Effects, mais d'éviter les configurations de très faible bande passante comme 3.0 x4. Développement de jeux / Production virtuelle : Unreal Engine Nos résultats de benchmark Unreal Engine se situent entre ceux de DaVinci Resolve et After Effects. Comme le premier, il y a un regroupement clair des bandes passantes, mais, comme AE, il n'y a pas de nombreux paliers distincts. 5.0 x16, x8, x4, 4.0 x16 et x8, et 3.0 x16 sont tous fonctionnellement identiques. 3.0 x16 semble légèrement plus lent que le reste, mais il est juste dans la marge d'erreur. Cependant, nous observons des écarts hors de la marge pour les bandes passantes plus basses. 4.0 x4 et 3.0 x8 sont 93% aussi rapides que les résultats à 64 G/s, et 3.0 x4 suit avec 90% de la performance. Dans l'ensemble, il s'agit de différences de performance minimes. Nous conseillons de faire preuve de prudence en configurant un GPU à 4.0 x4 ou moins, mais cela peut être un compromis acceptable pour des configurations multi-GPU ou pour faciliter l'installation de cartes additionnelles. Rendu GPU : Blender & Octane Pour cet article, nous avons testé trois benchmarks de rendu : V-Ray, Blender et Octane. Les résultats de V-Ray semblaient particulièrement anomallement, donc ils ne sont pas inclus dans les graphiques, bien qu'ils figurent dans les tables de résultats bruts. Dans Blender et Octane, nous n'avons observé quasiment aucun effet de la bande passante sur les performances. Dans Blender, la variation totale moyenne est d'environ 5%, et dans Octane, elle est de 2.5%. Tous les résultats sont largement dans la marge d'erreur, et nous ne pouvons pas tirer beaucoup de conclusions. Cela signifie qu'il n'y a probablement aucun effet négatif. Cela a du sens car les scènes sont intégralement chargées dans la mémoire VRAM du GPU, et le temps de chargement initial n'est pas pris en compte. Bien que certains modèles d'IA puissent déroger à cela en utilisant la RAM système, ce dernier cas entraîne une grande perte de performance. Ainsi, bien que la bande passante PCIe réduite puisse ralentir le chargement initial du modèle ou de la scène, son impact sur les performances après cela est négligeable. IA : Modèles Linguistiques Lourds (LLM) Enfin, notre benchmark Llama.cpp examine les performances du GPU dans le traitement de sollicitations et la génération de tokens. Pour les deux flux de travail, les résultats semblent aléatoires, sans schéma discernable. La différence globale de performance est également assez faible, d'environ 6% pour le traitement de sollicitations. Nous concluons généralement que la bande passante PCIe n'a que peu d'impact sur les performances d'IA. Cependant, nous soulignons que notre benchmark LLM est très petit, et que les configurations d'IA impliquent souvent plusieurs GPU qui déchargent une partie du modèle sur la RAM système. Dans ces cas, la bande passante PCIe peut avoir un impact important sur les performances globales. Conclusion Sur les cartes mères modernes, il n'y a généralement qu'un slot PCIe à une bande passante complète de 5.0 x16. Les slots supplémentaires peuvent être 5.0 x8, mais ils sont souvent beaucoup plus bas, à 4.0 x4 ou moins. Par conséquent, les configurations multi-GPU ou celles incluant des cartes additionnelles peuvent entraîner une réduction drastique de la bande passante PCIe. Dans l'édition vidéo et les graphismes en mouvement, nous avons observé l'impact le plus important. 5.0 x16, x8 et 4.0 x16 étaient fonctionnellement équivalents. Cependant, en dessous de ces niveaux, nous avons commencé à observer des différences, en particulier dans DaVinci Resolve. 3.0 x16 était 10% plus lent, et la configuration typique de 4.0 x4 était 25% plus lente. Ces marges sont réduites dans After Effects, mais toujours présentes. Nous recommandons d'être prudent lors de la configuration d'un système pour des applications d'édition vidéo utilisant plusieurs cartes péripériques, car la réduction du nombre de voies disponibles pour le GPU peut avoir un impact mesurable sur les performances. Notre benchmark Unreal Engine a également montré des impacts de bande passante PCIe, mais mineurs. Nous n'avons vu une diminution notable que lorsque la bande passante était réduite à 4.0 x4 (ou équivalent), avec une chute moyenne de 7% du fps. 3.0 x4 était légèrement pire, avec 10% de performance en moins que le maximum. Bien que ces pertes de performance ne soient pas dramatiques, elles doivent être prises en compte. Les moteurs de rendu hors-ligne et les benchmarks IA n'ont montré aucun impact de la bande passante PCIe sur les performances. Cela est logique car ces applications Chargent généralement toutes leurs données dans la mémoire VRAM du GPU et crashent si elles ne le peuvent pas. Il existe quelques exceptions avec les modèles d'IA, mais travailler hors de la RAM système entraîne une perte de performance massive. Par conséquent, bien que la bande passante PCIe réduite puisse ralentir le chargement initial d'un modèle ou d'une scène, son impact sur les performances après cela est négligeable. Lorsqu'on configure les systèmes que nous vendons, nous cherchons un équilibre entre la performance maximale des composants et le désir des clients d'avoir des cartes péripériques nécessaires à leur travail. Fréquemment, cela signifie réduire le GPU principal à PCIe 5.0 x8, ce qui réduit la bande passante PCIe de moitié. Comme nous l'avons montré dans cet article, cette diminution importante de la bande passante a souvent un impact minimal sur les performances dans des situations réelles. En dehors de rares cas, les tests confirment que, tant qu'on dispose d'une carte mère moderne supportant PCIe 5.0, il n'y a pas de problème à faire tourner le GPU à vitesse x8. Cependant, des cartes mères bas de gamme, qui obligeront le GPU à fonctionner à 4.0 x4, pourraient introduire des penalties de performance. Evaluation par les Professionnels de l'Industrie L'industrie reconnait l'importance du support PCIe 5.0, mais elle est également consciente des limitations en termes de disponibilité de voies PCIe sur les cartes mères grand public. Les marques comme ASUS ProArt sont louées pour leur meilleure gestion des slots PCIe, facilitant ainsi l'intégration de configurations plus complexes. Profil de l’entreprise Notre société, spécialisée dans les stations de travail de création de contenu, propose des configurations personnalisées pour répondre aux besoins spécifiques des utilisateurs. Nous prenons en compte la bande passante PCIe ainsi que l'intégration de cartes additionnelles, garantissant ainsi des solutions optimisées pour l'usage professionnel. Recherchez une station de travail pour la création de contenu ? Nous construisons des ordinateurs spécialement conçus pour votre flux de travail. Si vous ne savez pas par où commencer, contactez l'un de nos consultants techniques aujourd'hui. Ce résumé présente de manière concise les impacts de la bande passante PCIe 5.0 sur les performances des GPU dans différentes applications de création de contenu, offrant des recommandations claires et pratiques basées sur des tests rigoureux.

Related Links