Le Site Officiel Chinois De Nvidia a Supprimé Le 4090 Et La Portée De L'interdiction D'exportation De Puces a Été Élargie, Avec Les A40 Et A6000 Répertoriés

01 Les nouvelles règles du ministère américain du Commerce sur les exportations de puces vers la Chine entrent officiellement en vigueur
Le 16 novembre, heure locale, les nouvelles restrictions à l'exportation de puces et d'équipements semi-conducteurs (ci-après dénommées restrictions à l'exportation de puces) émises par le Bureau de l'industrie et de la sécurité (BIS) du ministère du Commerce des États-Unis sont officiellement entrées en vigueur.
Les nouvelles règles ont été mises à jour par le BIS le 17 octobre et visent à restreindre davantage l'achat par la Chine de puces informatiques haut de gamme et d'équipements semi-conducteurs impliquant des processus avancés. La secrétaire américaine au Commerce, Gina Raimondo, l’a dit sans détour :L'interdiction vise à limiter « l'accès de la Chine aux semi-conducteurs avancés qui pourraient conduire à des percées dans l'intelligence artificielle et le calcul haute performance (IA et HPC) ».
Le 17 novembre, le site Web officiel chinois de NVIDIA a supprimé le contenu lié à la carte graphique RTX 4090.

Deux captures d'écran de pages Web montrent que le contenu lié au 4090 a été supprimé de la page d'introduction de la carte graphique GeForce RTX série 40, et le rendu RTX 4090 utilisé à l'origine pour l'affichage a également été remplacé par RTX 4080.
Ce changement est une réponse directe aux nouvelles réglementations émises par le ministère américain du Commerce le 17 octobre, qui ont sévèrement restreint l’exportation de puces d’IA haut de gamme vers la Chine.Y compris la gamme de produits GPU hautes performances de NVIDIA - A100, H100, A800, H800, L40, L40S et le très attendu 4090.
Début octobre, pendant la période de divulgation des politiques, le ministère américain du Commerce a immédiatement interrompu l'exportation d'A800 et de H800 vers la Chine.
02 Fuite de documents de vente Dell:Les A40, A6000 et 4090 sont tous sur la liste des appareils interdits
Après que les États-Unis ont annoncé des restrictions sur les exportations de puces vers la Chine, l’incertitude et la tension dans l’industrie ont continué d’augmenter. Le 17 novembre, la tension semble avoir atteint son paroxysme.
Les documents de vente de Dell détaillaient les pays interdits, les modèles de produits, les conseils et d'autres informations. La liste des GPU Nvidia qui n'ont finalement pas réussi l'examen comprenait non seulement les cartes graphiques A100, H100, A800, H800, L40S, L40 et autres, attendues auparavant,Les A30, A40, L4 et RTX A6000 ont également été ajoutés.Parmi eux, la très attendue RTX 4090 figure également sur la liste.
Le débat au sein de la communauté des consommateurs nationaux sur la question de savoir si le 4090 figure sur la liste des produits interdits à la vente a également atteint un résultat définitif.

Documents de vente Dell : liste détaillée des pays interdits, modèles de produits, conseils, etc.
Parmi les autres produits interdits figurent plusieurs puces d’AMD et d’Intel.
Parmi eux, les produits restreints d'AMD couvrent ses GPU de niveau serveur, notamment les produits MI210, MI250, MI250X et tous les produits de la série MI300, ainsi que les cartes graphiques grand public RX7900 XTX, W7900 et RX7900XT.
Pour Intel, les restrictions s'appliquent à tous les produits Gaudi existants, ainsi qu'à toutes les cartes PVC et PCB/produits des séries Max et Flex.
Les modèles de GPU limités de NVIDIA sont répartis en termes de cœurs de calcul et de taille de mémoire :

Le modèle de langage large (LLM) nécessite une grande mémoire vidéo et un débit de bande passante élevé pendant le processus de calcul. Les cadres de raisonnement LLM courants tels que vLLM et xinference prennent généralement en charge NVIDIA jusqu'à sm75 ou même seulement sm80.
Après que l'interdiction a été étendue aux A6000 et A40, tous les produits à haute mémoire actuellement en production par NVIDIA ont été concernés. Les performances informatiques limitées sont graves, mais le manque de prise en charge de la mémoire vidéo est encore plus fatal.Le chargement de grands modèles dans la puce sera considérablement affecté.
De plus, bien que la mémoire vidéo des puces telles que RTX 4090, A30 et L4 soit petite,Cependant, comme il ne peut fournir que plus de 300Tops de puissance de calcul sur l'indicateur unique int8,Cela a eu pour conséquence que ces modèles de GPU ont été inclus dans la liste restreinte, même s'ils n'étaient pas initialement destinés à être interdits.
La taille de la mémoire requise par les principaux paramètres du modèle pendant l'inférence :

On peut voir que si les puces de spécification restreinte ne peuvent pas être obtenues, les LLM avec une échelle de paramètres de plus de 30 milliards seront obligés d'utiliser plus de puces pendant le processus d'inférence.Cependant, l'interconnexion entre cartes augmentera considérablement le coût de fonctionnement du modèle et réduira l'efficacité du raisonnement, ce qui affectera sérieusement l'application du LLM dans la mise en œuvre réelle de l'IA.
De plus, les cartes graphiques grand public telles que la 4090 sont en fait utilisées dans les pratiques de recherche scientifique fondamentale par de nombreux instituts de recherche scientifique en raison de leur rentabilité extrêmement élevée.
Le blocage des produits dotés d'une mémoire vidéo élevée et de tout indice de calcul supérieur à 300 Tflops (Tops) montre très clairement l'intention du ministère du Commerce américain de réduire l'indice d'interdiction des puces. Son objectif réel est double :Restreindre la recherche et le développement ainsi que l'application à grande échelle de grands modèles linguistiques dans l'industrie chinoise de l'intelligence artificielle, tout en limitant la base de recherche en IA de la communauté de recherche scientifique chinoise.
03 Les produits alternatifs de Nvidia ont des performances médiocres:Difficile de répondre aux besoins de raisonnement des LLM
Le 13 novembre, en réponse aux contrôles d'exportation des puces d'IA hautes performances des États-Unis vers la Chine, NVIDIA a confirmé qu'elle lancerait trois nouvelles puces d'IA - HGX H20, L20 PCIe et L2 PCIe, conçues spécifiquement pour le marché chinois.Les performances de ces nouvelles puces sont considérablement réduites par rapport à la série phare H100 de la société pour se conformer aux réglementations d'exportation américaines.
En particulier, la puce HGX H20, conçue pour répondre aux besoins de formation des modèles d'IA, aura une bande passante et une vitesse de calcul limitées, et sa puissance de calcul globale devrait être inférieure d'environ 80% à celle de la puce GPU H100.Cet ajustement des performances réduit la puissance de calcul du HGX H20 à seulement un cinquième de celle du H100.
Bien que les trois puces soient conformes à l'interdiction d'exportation américaine, leurs performances ne sont comparables qu'aux architectures Volta et Turing de Nvidia d'il y a cinq à six ans.Ces deux générations de produits sont abandonnées depuis plus de 2-3 ans.

Nvidia lancera trois puces castrées pour se conformer aux restrictions d'exportation de puces américaines vers la Chine
Bien que la puce principale Hopper dispose d'une unité d'accélération dédiée intégrée pour l'architecture Attention, elle est similaire à l'architecture DSA.Cependant, la vitesse des LLM de raisonnement de base après la castration sera toujours considérablement réduite.Cela entraînera une augmentation significative des coûts pour les entreprises acheteuses.
En outre, le ministère du Commerce des États-Unis a modifié sa politique d’interdiction de vente des versions simplifiées du H800 et de l’A800.Si l'optimisation des LLM par H20 maintient des performances supérieures, elle sera probablement à nouveau incluse dans la liste des interdictions.
04 Il est impératif d’établir une chaîne industrielle nationale indépendante
Depuis 2021, TSMC et d'autres fabricants internationaux de puces sont tenus de soumettre une « demande d'informations » aux autorités américaines.La demande comprend des informations clés telles qu'une liste des principaux clients, l'inventaire et la part des revenus.
Octobre 2023L'interdiction des sanctions américaines sur les puces électroniques imposée à la Chine s'est étendue à Moore Threads et BiRen Technology après Huawei, Cambrian et d'autres fabricants.D'autres puces nationales avec plus de 300 Tflops ou Tops dans n'importe quel indicateur de calcul, même si elles peuvent être inférieures aux indicateurs de calcul de l'interdiction de contrôle américaine, sont toujours soumises à une intervention car elles affectent l'intention des États-Unis de contenir la Chine.

Les indicateurs de taux de hachage des puces affectés par l'interdiction
Dans ce contexte, l’industrie chinoise des puces électroniques est confrontée à un tournant critique.
Pour maintenir sa compétitivité en matière d’intelligence artificielle et de recherche scientifique avancée et surmonter les goulots d’étranglement du développement, la Chine doit accélérer la construction d’une chaîne de R&D indépendante et contrôlable.Ce processus nécessite non seulement de renforcer la recherche et le développement des technologies de base, mais également de parvenir à l’autosuffisance dans divers aspects tels que les matériaux, la conception, la fabrication, l’emballage et les tests afin de garantir que les progrès scientifiques et technologiques ne soient pas perturbés par des facteurs externes.
Bien que cet objectif soit ambitieux, il constitue le seul moyen pour la Chine d’assurer sa sécurité technologique à long terme et le développement durable de son industrie.