Moore Threads präsentiert next-gen-GPUs mit 15fachem Gaming- und 50fachem Ray-Tracing-Sprung
Chinesischer GPU-Hersteller Moore Threads hat auf seiner MUSA-Entwicklerkonferenz die nächste Generation seiner Architektur, „Huagang“, vorgestellt, die 2025 auf den Markt kommen soll. Zentrale Produkte sind die Gaming-GPU „Lushan“ und die AI-GPU „Huashan“, beide auf Basis der neuen Architektur. Lushan soll eine 15-fache Steigerung bei AAA-Gaming-Leistung und eine beeindruckende 50-fache Verbesserung bei Ray-Tracing-Performance bringen – eine enorme Steigerung gegenüber den aktuellen MTT S80 und S90, die bisher nur knapp die Leistung einer RTX 4060 erreichen. Auch in anderen Bereichen werden massive Fortschritte erwartet: 64-fache Steigerung bei AI-Computing, 16-fache Verbesserung bei Texture-Geometry-Verarbeitung, 8-fache Erhöhung bei Atom-Access und 4-fache Erweiterung der Speicherkapazität. Die neuen GPUs sollen bis zu 64 GB GDDR6-VRAM unterstützen, was die Leistungsfähigkeit deutlich erhöhen könnte. Ein zentraler Fortschritt ist die vollständige Unterstützung moderner APIs wie DirectX 12 Ultimate sowie ein zweite Generation hardwarebeschleunigter Ray-Tracing-Engine. Zusätzlich wurde ein neuer AI-Hardware-Block für die „UniTE“-Architektur eingeführt, um die Rendering-Pipeline auf das Niveau von Nvidia, AMD und Intel zu bringen. Für die AI-Performance zeigt Moore Threads bereits heute beeindruckende Ergebnisse: Auf der MTT S5000 erreichte DeepSeek V3 eine Decoding-Geschwindigkeit von 1000 Tokens pro Sekunde und 4000 Tokens pro Sekunde beim Prefill – leicht über den Leistungen von Nvidia’s Hopper-Architektur. Parallel dazu wurde die „Huashan“-AI-GPU vorgestellt, eine zweichipletige Lösung mit acht HBM-Speichermodulen. Sie soll die Leistung von Nvidia’s Hopper- und Blackwell-GPUs erreichen, mit sogar höherer Speicherbandbreite als die B200. Die Effizienz steigt um das Zehnfache, die Compute-Dichte um 50 %. Unterstützt werden FP4 bis FP64-Computing sowie exklusive niedrigpräzise Mischformate wie MTFP4, MTFP6 und MTFP8. Über die MTLink 4.0-Verbindung sollen mehr als 100.000 GPUs mit bis zu 1314 GB/s Datenübertragungsrate in AI-Fabriken skalierbar verbunden werden. Obwohl bisher keine Benchmarks vorliegen, deutet alles auf einen ernsthaften Angriff auf den globalen GPU-Markt hin. Mit staatlicher Unterstützung und ambitionierten Zielen zur technologischen Selbstständigkeit will Moore Threads nicht nur den chinesischen Markt, sondern auch globale Player herausfordern. Die Entwicklung zeigt, dass China in der GPU-Entwicklung zunehmend selbstbewusst wird – besonders im Bereich AI-Hardware. Branchenexperten sehen in Moore Threads eine der wichtigsten Herausforderungen für Nvidia und AMD in Asien. Die hohe Bandbreite und Effizienz der Huashan-GPU könnte besonders für große Sprachmodelle relevant sein. Zudem könnte die 64 GB VRAM-Kapazität einen entscheidenden Vorteil bei Datenzentren bieten. Wenn die angekündigten Leistungssteigerungen tatsächlich erreicht werden, könnte Moore Threads zum führenden Spieler im AI-GPU-Markt werden – besonders im Kontext der geopolitischen Spannungen und der zunehmenden Nachfrage nach lokalen Alternativen.
