Zhaoxin KX-7000 : Un Nouveau CPU Chinois Visant les Performances avec l’Architecture "Century Avenue"
Zhaoxin’s KX-7000 : Un Pas Importé Vers l'Autonomie Technologique Chinoise Zhaoxin, une entreprise chinoise spécialisée dans la conception de processeurs x86, vient d'introduire son dernier CPU, le KaiXian KX-7000. Ce nouveau processeur repose sur une nouvelle architecture baptisée "世纪大道" (Century Avenue), en référence à une avenue célèbre de Shanghai. Zhaoxin est une entreprise unique car il s'agit d'un partenariat entre VIA Technologies et le gouvernement municipal de Shanghai. Le KX-7000 profite du savoir-faire de VIA en matière de licence x86-64 et bénéficie d'un soutien gouvernemental considérable, ce qui lui donne un avantage significatif pour concurrencer les puces Western de haute performance. Architecture et Performances 1. Caractéristiques générales - Cœurs : Le KX-7000 dispose de huit cœurs utilisant l'architecture Century Avenue. - Cache : Les huit cœurs partagent 32 Mo de mémoire cache L3, ce qui représente une augmentation notable par rapport aux 4 Mo du précédent processeur LuJiaZui. - Configuration : Une structure de type chiplet est utilisée, similaire aux processeurs AMD Ryzen. Tous les cœurs sont situés sur une même puce et partagent cette mémoire cache L3. 2. Performance du Cœur - Largeur : Century Avenue est un cœur 4-wide avec une compatibilité AVX2, ce qui lui permet d'exécuter plus d'instructions simultanément. - Fréquence : Le KX-7000 fonctionne à 3,2 GHz, voire jusqu'à 3,5 GHz selon certaines affirmations, bien que cette dernière fréquence n'ait jamais été observée pendant les tests. - Prise en charge des instructions : Le cœur possède un cache d'instructions de 64 Ko (64 KB 16-way) qui peut fournir 16 octets par cycle au décodeur 4-wide. - Buffet de cibles de branches (BTB) : Disposant de 4096 entrées, le BTB crée deux ruptures d'pipeline après un branchement effectué, ce qui est une régression par rapport à LuJiaZui, qui avait des performances meilleures en termes de latence de prédiction des branches. 3. Capacités de Performance - Frontend : L'unité frontale vise à livrer jusqu'à quatre instructions par cycle avec des ressources minimales. Cependant, elle souffre de certains défauts, notamment une largeur de bande limitée à 16 bytes par cycle, ce qui peut contraindre le débit si la taille moyenne des instructions dépasse 4 bytes. - Rearrangeur (ROB) : Avec 192 entrées, Century Avenue offre une capacité de réorganisation comparable à celle d'Intel Haswell et d'AMD Zen, mais reste inférieur en termes de fichiers de registres physiques. - Unité de points flottants (FPU) / Vecteurs : L'unité Floating Point est particulièrement puissante, capable d'exécuter deux instructions 256-bit FMA par cycle, avec des latences normales pour les additions et multiplications (3 et 5 cycles, respectivement). - Gestion de la mémoire : - L1 cache de données : 32 Ko, 8-way associative, avec 4 cycles de latence load-to-use. - L2 cache : Latence de 15 cycles, ce qui est moyenne mais non impressionnante. - L3 cache : Avec une latence de plus de 27 nanosecondes, il reste un point faible du processeur. 4. Bande passante et latences - DRAM : Latence excessive, dépassant souvent 200 ns, et une bande passante limitée à environ 12 GB/s en lecture, bien qu'elle puisse atteindre 20 GB/s en lecture-modification-écriture. Ces limitations peuvent affecter significativement les performances dans certaines charges de travail. - Latence inter-cœurs : Les communications entre les cœurs présentent une latence élevée mais uniforme, indiquant une topologie de système complexe. Tests Performances SPEC CPU2017 - Suites entières (Integers) : Le KX-7000 offre une amélioration de 48,8% par rapport à LuJiaZui, mais reste en phase avec AMD's Bulldozer (2011) en termes de performances. - Suites à points flottants (Floats) : Zhaoxin surpasse Bulldozer de 10,4%, grâce à sa puissance AVX2, mais ne peut toujours pas rivaliser avec les processeurs plus récents comme Skylake. Tests Multicœurs - libx264 : Malgré l'avantage de ses huit cœurs, il est surpassé même par Bulldozer. - 7-Zip : Performances médiocres en compression, dominé par Bulldozer et Skylake. - Y-Cruncher : Meilleure performance, mais encore inférieur à Skylake malgré une utilisation intensive d'AVX2. - OpenSSL RSA2048 : Supérieur à Bulldozer en termes de calcul, mais encore derrière Skylake. Contexte Industriel et Évaluation Zhaoxin hérite de la licence x86 de VIA Technologies, mais s'éloigne des applications à faible puissance et coût pour viser des marchés plus exigeants. Ce changement stratégique reflète l'effort national chinois pour développer des composants électroniques indigènes en cas de restrictions d'approvisionnement provenant de l'Occident. Points forts et faibles - Avantages : - Progrès significatifs en termes de latence des prédicteurs de branches et de capacités de réorganisation. - Performance à points flottants competitive dans certaines charges de travail grâce à une unité FPU puissante. - Soutien gouvernemental massif qui permet à Zhaoxin de poursuivre ses efforts sans contraintes financières immédiates. - Faiblesses : - Le frontend souffre d'une latence élevée et manque de techniques avancées comme la fusion des branches. - La bande passante des caches L1 et L2 est insuffisante, rendant le processeur vulnérable aux bogs de performance liés aux accès mémoire. - Latence excessive de la RAM et du cache L3, empêchant des performances optimales dans les tâches multitâches. Conclusion Malgré ses limitations, le KX-7000 représente un bond significatif en avant pour Zhaoxin. Avec une performance mono-cœur s'alignant sur AMD's Bulldozer, il est capable de fournir une expérience utilisateur acceptable. Cependant, les performances multicœurs restent en deçà des attentes, notamment face à des puces plus modernes. Zhaoxin a fait le choix de prioriser la compatibilité AVX2 et la performance théorique, ce qui a conduit à des déséquilibres au niveau de la gestion de la mémoire et des ressources internes. Néanmoins, l'effort d'innovation est remarquable, et le KX-7000 marque une avancée importante dans la quête de l'autonomie technologique chinoise. Les prochains modèles devraient bénéficier des leçons apprises avec Century Avenue pour améliorer ces aspects critiques.