HyperAI

Auf Der Offiziellen Chinesischen Website Von Nvidia Wurde 4090 Gelöscht Und Der Umfang Des Chip-Exportverbots Wurde Erweitert, Wobei A40 Und A6000 Aufgeführt Wurden

vor einem Jahr
Information
h.li
特色图像

01 Die neuen Regeln des US-Handelsministeriums für Chipexporte nach China treten offiziell in Kraft

Am 16. November Ortszeit traten die neuen Exportbeschränkungen für Chips und Halbleiterausrüstung (nachfolgend als Chip-Exportbeschränkungen bezeichnet) des Bureau of Industry and Security (BIS) des US-Handelsministeriums offiziell in Kraft.

Die neuen Regeln wurden am 17. Oktober vom BIS aktualisiert und zielen darauf ab, Chinas Kauf von High-End-Computerchips und Halbleiterausrüstung mit fortschrittlichen Verfahren weiter einzuschränken. US-Handelsministerin Gina Raimondo brachte es unverblümt auf den Punkt:Das Verbot zielt darauf ab, Chinas „Zugang zu fortschrittlichen Halbleitern einzuschränken, die Durchbrüche in der künstlichen Intelligenz und im Hochleistungsrechnen (KI und HPC) vorantreiben könnten.“

Am 17. November entfernte die offizielle chinesische Website von NVIDIA Inhalte im Zusammenhang mit der Grafikkarte RTX 4090.

Aus zwei Schnappschüssen von Webseiten geht hervor, dass die 4090-bezogenen Inhalte von der Einführungsseite der Grafikkarten der GeForce RTX 40-Serie entfernt wurden und dass das ursprünglich zur Anzeige verwendete RTX 4090-Rendering ebenfalls durch RTX 4080 ersetzt wurde.

Die Änderung ist eine direkte Reaktion auf neue Vorschriften des US-Handelsministeriums vom 17. Oktober, die den Export hochwertiger KI-Chips nach China stark einschränkten.Einschließlich der Hochleistungs-GPU-Produktlinie von NVIDIA – A100, H100, A800, H800, L40, L40S und der mit Spannung erwartete 4090.

Bereits Mitte/Ende Oktober, während der Offenlegungsfrist, stoppte das US-Handelsministerium den Export von A800 und H800 nach China.

02 Dell-Verkaufsunterlagen durchgesickert:A40, A6000, 4090 stehen alle auf der Verbotsliste

Nachdem die USA Beschränkungen für Chipexporte nach China angekündigt hatten, nahmen Unsicherheit und Spannungen in der Branche weiter zu. Am 17. November schienen die Spannungen ihren Höhepunkt zu erreichen.

In den Verkaufsunterlagen von Dell sind die verbotenen Länder, Produktmodelle, Anleitungen und andere Informationen aufgeführt. Die Liste der Nvidia-GPUs, die den Test letztendlich nicht bestanden haben, umfasste nicht nur die zuvor erwarteten Grafikkarten A100, H100, A800, H800, L40S, L40 und andere,A30, A40, L4 und RTX A6000 wurden ebenfalls hinzugefügt.Darunter ist auch die mit Spannung erwartete RTX 4090 auf der Liste.

Auch die Diskussion in der heimischen Verbrauchergemeinde, ob 4090 auf der Verkaufsverbotsliste steht, hat ein eindeutiges Ergebnis erzielt.

Verkaufsunterlagen von Dell: detaillierte Liste der verbotenen Länder, Produktmodelle, Anleitungen und Vorschläge usw.

Zu den weiteren verbotenen Produkten gehören mehrere Chips von AMD und Intel.

Zu den eingeschränkten Produkten von AMD gehören unter anderem die GPUs auf Serverebene, darunter MI210, MI250, MI250X und alle Produkte der MI300-Serie, sowie die Grafikkarten für Verbraucher RX7900 XTX, W7900 und RX7900XT.

Bei Intel gelten die Einschränkungen für alle bestehenden Gaudi-Produkte sowie alle PVC- und PCB-Boards/Produkte der Max- und Flex-Serie.

Die eingeschränkten GPU-Modelle von NVIDIA sind hinsichtlich Rechenkernen und Speichergröße verteilt:

Large Language Model (LLM) erfordert einen großen Videospeicher und eine hohe Bandbreite während des Berechnungsprozesses. Gängige LLM-Reasoning-Frameworks wie vLLM und xinference unterstützen NVIDIA normalerweise bis zu sm75 oder sogar nur sm80.

Nachdem das Verbot auf A6000 und A40 ausgeweitet wurde, waren alle derzeit von NVIDIA produzierten Produkte mit hohem Speicherbedarf betroffen. Gravierend ist die eingeschränkte Rechenleistung, noch fataler ist jedoch die fehlende Videospeicherunterstützung.Das Laden großer Modelle in den Chip wird erheblich beeinträchtigt.

Darüber hinaus ist der Videospeicher von Chips wie RTX 4090, A30 und L4 zwar klein,Da jedoch nur mehr als 300Tops Rechenleistung auf dem einzelnen Indikator int8 bereitgestellt werden können,Dies führte dazu, dass diese GPU-Modelle in die Sperrliste aufgenommen wurden, obwohl ihr Verbot ursprünglich nicht vorgesehen war.

Die von den gängigen Modellparametern während der Inferenz benötigte Speichergröße:

Es ist ersichtlich, dass LLMs mit einer Parameterskala von mehr als 30 Milliarden gezwungen sind, während des Inferenzprozesses mehr Chips zu verwenden, wenn die Chips mit eingeschränkter Spezifikation nicht erhältlich sind.Allerdings erhöht die kartenübergreifende Verbindung die Kosten für den Modellbetrieb erheblich und verringert die Effizienz der Argumentation, was die Anwendung von LLM bei der tatsächlichen Implementierung von KI ernsthaft beeinträchtigen wird.

Darüber hinaus werden Grafikkarten der Verbraucherklasse wie die 4090 aufgrund ihrer extrem hohen Kosteneffizienz tatsächlich von vielen wissenschaftlichen Forschungsinstituten in der Grundlagenforschung eingesetzt.

Das Blockieren von Produkten mit hohem Videospeicher und jedem Rechenindex über 300 Tflops (Tops) macht die Absicht des US-Handelsministeriums, den Chip-Verbotsindex zu senken, sehr deutlich. Sein eigentlicher Zweck ist zweifach:Beschränken Sie die Forschung und Entwicklung sowie die groß angelegte Anwendung großer Sprachmodelle in Chinas künstlicher Intelligenzbranche und schränken Sie gleichzeitig die KI-Forschungsgrundlage der chinesischen wissenschaftlichen Forschungsgemeinschaft ein.

03 Die Alternativprodukte von Nvidia weisen eine schlechte Leistung auf:Es ist schwierig, den Denkanforderungen von LLMs gerecht zu werden

Als Reaktion auf die US-Exportkontrollen für leistungsstarke KI-Chips nach China bestätigte NVIDIA am 13. November die Einführung von drei neuen KI-Chips – HGX H20, L20 PCIe und L2 PCIe, die speziell für den chinesischen Markt entwickelt wurden.Die Leistung dieser neuen Chips ist im Vergleich zur Flaggschiff-Serie H100 des Unternehmens erheblich reduziert, um den US-Exportbestimmungen zu entsprechen.

Insbesondere der HGX H20-Chip, der für die Anforderungen des KI-Modelltrainings entwickelt wurde, verfügt über eine begrenzte Bandbreite und Rechengeschwindigkeit und seine Gesamtrechenleistung wird voraussichtlich etwa 80% niedriger sein als die des H100-GPU-Chips.Durch diese Leistungsanpassung beträgt die Rechenleistung des HGX H20 nur ein Fünftel der des H100.

Obwohl alle drei Chips dem US-Exportverbot entsprechen, ist ihre Leistung nur mit den Volta- und Turing-Architekturen von Nvidia vor fünf bis sechs Jahren vergleichbar.Die Produktion dieser beiden Produktgenerationen ist seit mehr als 2–3 Jahren eingestellt.

Nvidia wird drei kastrierte Chips auf den Markt bringen, um den US-Chip-Exportbeschränkungen für China nachzukommen

Obwohl der Hopper-Core-Chip über eine integrierte dedizierte Beschleunigungseinheit für die Attention-Architektur verfügt, ähnelt er der DSA-Architektur.Allerdings wird die Geschwindigkeit der LLMs zum Kernschlussfolgern nach der Kastration immer noch stark reduziert sein.Dies führt zu einer deutlichen Kostensteigerung für die einkaufenden Unternehmen.

Darüber hinaus hat das US-Handelsministerium seine Verkaufsverbotsrichtlinien für die vereinfachten Versionen von H800 und A800 geändert.Wenn die LLM-Optimierung von H20 weiterhin eine überlegene Leistung bietet, wird es wahrscheinlich wieder auf die Verbotsliste gesetzt.

04 Es ist zwingend erforderlich, eine unabhängige inländische Industriekette aufzubauen

Seit 2021 sind TSMC und andere internationale Chiphersteller verpflichtet, bei den US-Behörden „Request for Information“ einzureichen.Die Anfrage umfasst wichtige Informationen wie eine Liste der Hauptkunden, Lagerbestände und Umsatzbeteiligungen.

Oktober 2023Das US-Sanktionsverbot für Chips in China wurde nach Huawei, Cambrian und anderen Herstellern auf Moore Threads und BiRen Technology ausgeweitet.Andere inländische Chips mit mehr als 300 Tflops oder Tops in einem beliebigen Rechenindikator unterliegen, obwohl sie möglicherweise niedriger sind als die Rechenindikatoren im US-Kontrollverbot, dennoch Interventionen, da sie die Absicht der USA beeinträchtigen, China einzudämmen.

Vom Verbot betroffene Chip-Hashrate-Indikatoren

Vor diesem Hintergrund steht Chinas Chipindustrie vor einem kritischen Wendepunkt.

Um seine Wettbewerbsfähigkeit im Bereich der künstlichen Intelligenz und der fortgeschrittenen wissenschaftlichen Forschung aufrechtzuerhalten und Entwicklungsengpässe zu überwinden, muss China den Aufbau einer unabhängigen und kontrollierbaren F&E-Kette beschleunigen.Dieser Prozess erfordert nicht nur die Stärkung der Forschung und Entwicklung von Kerntechnologien, sondern auch die Erreichung von Autarkie in verschiedenen Bereichen wie Materialien, Design, Herstellung, Verpackung und Prüfung, um sicherzustellen, dass der wissenschaftliche und technologische Fortschritt nicht durch externe Faktoren gestört wird.

Dieses Ziel ist zwar eine Herausforderung, doch es ist für China die einzige Möglichkeit, seine technologische Sicherheit langfristig zu sichern und eine nachhaltige Entwicklung der Branche zu erreichen.