HyperAI

Chinas Ziel, im Bereich der künstlichen Intelligenz vollständig unabhängig zu werden, hat einen bedeutenden Meilenstein erreicht. Auf der Huawei China Partner Conference 2026 in Shenzhen stellte das Unternehmen den neuen AI-Beschleuniger Atlas 350 vor. Dieser neue Neural Processing Unit (NPU) basiert auf dem hauseigenen Ascend 950PR-Chip und stellt ein wesentliches Upgrade gegenüber der Vorgängerserie mit der Ascend 910-Architektur dar. Huawei positioniert den Atlas 350 als hocheffiziente Lösung speziell für die Prefill-Phase, also den inferenzintensiven Beginn von KI-Modellen. Das Gerät bietet eine Rechenleistung von 1,56 Peta-FLOPS im FP4-Format (16-Bit-Gleitkommazahlen). Das Unternehmen wirbt damit, dass diese Leistung etwa 2,87-mal höher ist als die der speziellen H20-Produkte von Nvidia, die ausschließlich für den chinesischen Markt bestimmt sind. Diese direkte Vergleichszahl ist technisch jedoch schwer unabhängig zu verifizieren, da die aktuellen Nvidia-Hopper-Architekturen FP4 nicht nativ unterstützen, während der Atlas 350 als erster chinesischer Eigenbau speziell für diese Präzision optimiert wurde. Die technischen Spezifikationen des Ascend 950PR sehen ursprünglich 128 GB Speicher mit einer Bandbreite von 1,6 Terabyte pro Sekunde vor. Berichte zum Atlas 350 deuten jedoch auf eine maximale Speichergeschwindigkeit von 1,4 Terabyte pro Sekunde hin. Die Granularität des Speicherzugriffs wurde dabei von 512 auf 128 Byte reduziert. Für die Verbindung mehrerer Chips nutzt der Atlas 350 das neue LingQu-Protokoll, das eine Interconnect-Bandbreite von 2 Terabyte pro Sekunde ermöglicht. Dies entspricht einem Anstieg um 2,5-mal gegenüber der bisherigen Ascend 910-Serie. Der Chip verbraucht 600 Watt und liegt damit 200 Watt über dem Stromverbrauch der konkurrierenden Nvidia H20. Diese Leistungsdaten erscheinen besonders beeindruckend, wenn man die aktuellen US-Sanktionen gegen China berücksichtigt. Huawei ist der Zugang zu TSMCs fortschrittlichem CoWoS-Verfahren zum Stapeln von HBM-Speicher (High Bandwidth Memory) nahe dem GPU-Chip verwehrt, welches Nvidia nutzt. Stattdessen setzt Huawei auf andere fortschrittliche Packaging-Technologien und eigene Speicherkomponenten, die mit Angeboten von Herstellern wie SK Hynix und Micron konkurrieren sollen, wobei der konkrete Lieferant derzeit noch unbekannt ist. Eine genaue Verfügbarkeit wurde nicht öffentlich bekannt gegeben, doch hält Huawei sein Versprechen aus der Vergangenheit ein: Die Serienproduktion des Ascend 950PR sollte im ersten Quartal 2026 beginnen. Schätzungen des Finanzanbieters BigGo Finance zufolge liegt der Preis des NPUs bei etwa 111.000 Yuan, was umgerechnet etwa 16.000 US-Dollar entspricht. Zum Vergleich: Die Nvidia H20 ist in der Region zwischen 15.000 und 25.000 Dollar teuer. Bei solchen Werten sollten vorsichtige Bewertungen vorgenommen werden, da der Markt für AI-GPUs oft keine transparenten Standardpreise aufweist. Obwohl weiterhin viele Ascend-Chips im Entwicklungsstadium sind, nutzen chinesische Unternehmen weiterhin auch nicht beschleunigte Nvidia-GPUs, da die lokale Silizium-Produktion noch nicht ganz wettbewerbsfähig ist und die CUDA-Software-Plattform von Nvidia etabliert ist. Der Atlas 350 markiert dennoch einen ernsthaften Schritt in Richtung der Schließung dieser Lücke und der angestrebten technologischen Autarkie im KI-Bereich.

Verwandte Links

Verwandte Links

Verwandte Links

Online-Tutorial | Qwen 3.5 27B: Zusammenführung Der Inferenzfunktionen Von Claude 4.6 Opus – Balance Zwischen Hoher Ausgabequalität Und Einfacher Implementierung

Online-Tutorial | Qwen 3.5 27B: Zusammenführung Der Inferenzfunktionen Von Claude 4.6 Opus – Balance Zwischen Hoher Ausgabequalität Und Einfacher Implementierung

Command Palette

Huawei stellt Atlas 350 KI-Beschleuniger vor

Verwandte Links

Command Palette

Huawei stellt Atlas 350 KI-Beschleuniger vor

Verwandte Links

Command Palette

Huawei stellt Atlas 350 KI-Beschleuniger vor

Verwandte Links

Online-Tutorial | Qwen 3.5 27B: Zusammenführung Der Inferenzfunktionen Von Claude 4.6 Opus – Balance Zwischen Hoher Ausgabequalität Und Einfacher Implementierung

Online-Tutorial | Qwen 3.5 27B: Zusammenführung Der Inferenzfunktionen Von Claude 4.6 Opus – Balance Zwischen Hoher Ausgabequalität Und Einfacher Implementierung