HyperAI

Au cours de la conférence Huawei China Partner 2026 à Shenzhen, l'entreprise a dévoilé l'Atlas 350, un nouvel accélérateur d'intelligence artificielle conçu pour renforcer l'autonomie technologique de la Chine. Ce nouveau processeur NPU repose sur la puce Ascend 950PR développée en interne, marquant une évolution significative par rapport à la génération précédente de silicium Ascend 910. L'Atlas 350 est positionné comme une solution haut de gamme optimisée pour la phase de préfixation, qui correspond à l'étape d'inférence dans le déploiement des modèles d'IA. La puce affiche une puissance de calcul de 1,56 pétaflops en précision FP4, une mesure de performance utilisée pour évaluer l'efficacité des calculs de point flottant à faible précision. Huawei revendique que cette performance est 2,87 fois supérieure à celle du H20 d'Nvidia, une version spécifiquement adaptée au marché chinois. Il est important de noter que cette comparaison présente des limites méthodologiques, car les puces d'architecture Hopper d'Nvidia ne prennent pas encore en natif la précision FP4, tandis que l'Atlas 350 est le premier accélérateur chinois à être entièrement optimisé pour cette norme. Sur le plan de la mémoire, la puce Ascend 950PR sous-jacente dispose théoriquement de 128 Go de mémoire HBM avec une bande passante de 1,6 térabits par seconde. Cependant, les rapports concernant l'Atlas 350 indiquent une bande passante effective maximale de 1,4 térabits par seconde. Cette configuration s'accompagne d'une réduction de la granularité d'accès à la mémoire, passant de 512 octets à 128 octets pour améliorer l'efficacité des requêtes. Le système utilise également un nouveau protocole d'interconnexion appelé LingQu, offrant une bande passante de 2 térabits par seconde, soit 2,5 fois plus rapide que la série Ascend 910 précédente. La consommation énergétique de l'Atlas 350 est estimée à 600 watts, ce qui représente 200 watts de plus que le H20 d'Nvidia. Cette performance est d'autant plus remarquable qu'elle est obtenue sous le régime de sanctions américaines, qui empêchent Huawei d'accéder à la technologie CoWoS de TSMC utilisée par Nvidia pour empiler la mémoire HBM près de la puce. Pour pallier cette contrainte, Huawei a mis au point ses propres techniques de packaging avancé et produit sa propre mémoire, bien que le fournisseur réel ne soit pas confirmé. Ces composants visent à rivaliser avec les produits de géants comme SK Hynix et Micron. Bien que la disponibilité précise n'ait pas été officialisée, Huawei respecte sa promesse de mise sur le marché au premier trimestre 2026. Selon des estimations du marché, le prix de l'unité serait d'environ 111 000 yuans, soit environ 16 000 dollars. Ce tarif se situe dans une fourchette comparable aux tarifs du H20, qui varient entre 15 000 et 25 000 dollars sur le marché local, bien que les prix réels des puces d'IA restent difficiles à évaluer avec précision en raison de l'absence de marché ouvert. Malgré les efforts considérables déployés pour atteindre l'indépendance matérielle, les entreprises chinoises continuent d'acquérir des GPU d'Nvidia, y compris les modèles standards, en raison de la maturité de l'écosystème logiciel CUDA et des performances encore supérieures des solutions étrangères dans certains scénarios. Toutefois, l'Atlas 350 représente une avancée majeure dans la tentative de combler l'écart technologique et de réduire la dépendance aux équipements étrangers, confirmant l'ambition de la Chine de devenir entièrement autonome dans le domaine de l'intelligence artificielle.

Liens associés

Liens associés

Liens associés

Tutoriel En Ligne | Qwen 3.5 27B Distillation Des Capacités d'inférence De Claude 4.6 Opus : Équilibre Entre Production De Haute Qualité Et Déploiement À Faible Barrière

Tutoriel En Ligne | Qwen 3.5 27B Distillation Des Capacités d'inférence De Claude 4.6 Opus : Équilibre Entre Production De Haute Qualité Et Déploiement À Faible Barrière

Command Palette

Huawei dévoile l'accélérateur IA Atlas 350

Liens associés

Command Palette

Huawei dévoile l'accélérateur IA Atlas 350

Liens associés

Command Palette

Huawei dévoile l'accélérateur IA Atlas 350

Liens associés

Tutoriel En Ligne | Qwen 3.5 27B Distillation Des Capacités d'inférence De Claude 4.6 Opus : Équilibre Entre Production De Haute Qualité Et Déploiement À Faible Barrière

Tutoriel En Ligne | Qwen 3.5 27B Distillation Des Capacités d'inférence De Claude 4.6 Opus : Équilibre Entre Production De Haute Qualité Et Déploiement À Faible Barrière