Intel et AMD lancent ACE, extensions IA pour x86
Intel et AMD viennent de publier la spécification complète des extensions processeur ACE, conçues pour optimiser l'exécution des charges de travail d'intelligence artificielle sur l'architecture x86. Si les unités de calcul graphique dominent généralement le domaine, les processeurs restent préférables pour les modèles légers, les opérations sensibles à la latence ou les systèmes dépourvus de carte dédiée. L'architecture ACE répond précisément à ce besoin en introduisant un jeu d'instructions spécialisé dans le calcul matriciel, fondamental pour les algorithmes modernes. Contrairement aux instructions AVX10 existantes, initialement non conçues pour le traitement bidimensionnel, ACE intègre des circuits siliconiques dédiés à la multiplication matricielle tout en conservant les registres de 512 bits. Cette approche garantit une meilleure efficacité énergétique et une intégration simplifiée dans les conceptions actuelles. Pour un même nombre de vecteurs d'entrée, les instructions ACE exécutent jusqu'à seize fois plus d'opérations que leurs équivalents AVX10. Cette capacité réduit la surcharge processeur et améliore l'utilisation de la bande passante mémoire. Bien que le gain de vitesse dépende des implémentations matérielles, les constructeurs devraient réserver davantage de ressources siliconiques à cette fonctionnalité dans leurs futures puces. Au-delà des performances, ACE se veut indépendant du matériel spécifique. Les principaux frameworks de machine learning, tels que PyTorch et TensorFlow, pourront compiler un seul chemin d'exécution optimisé, évitant ainsi la maintenance de multiples versions logicielles. L'extension prend en charge nativement les formats de données standard en IA, incluant les entiers et les nombres à virgule flottante couramment utilisés. Elle supporte également les formats MX à échelle bloc du Open Compute Project, une fonctionnalité absente de la norme AVX10. Cette standardisation permet de déplacer certaines tâches traditionnellement confiées aux unités de traitement neuronal vers le processeur central, tout en garantissant une compatibilité uniforme sur l'ensemble de la plateforme x86. En simplifiant le développement logiciel et en réduisant la consommation d'énergie, les extensions ACE consolident le rôle du processeur comme une alternative efficace pour l'IA embarquée et les applications temps réel, sans fragmenter l'écosystème actuel.
