AMD et Qualcomm annoncent le support de leurs puces pour les modèles open-source GPT-OSS, ouvrant la voie à l’IA embarquée puissante sur PC et mobile
AMD et Qualcomm ont récemment annoncé que leurs architectures matérielles seront désormais compatibles avec la série de modèles open-source GPT-OSS lancée par OpenAI, marquant une avancée majeure dans l’intégration de l’intelligence artificielle au niveau du bord (edge computing). Ce nouveau cadre ouvert permet une exécution locale de modèles d’IA complexes sur des appareils grand public, réduisant la dépendance aux serveurs distants. La série GPT-OSS comprend deux modèles : GPT-OSS-20B, plus léger, et GPT-OSS-120B, plus puissant. Le premier peut s’exécuter de manière fluide sur un appareil disposant de 16 Go de mémoire vive, tandis que le second peut être lancé efficacement sur une seule carte graphique dotée de 80 Go de mémoire. AMD se félicite d’avoir fait de son processeur Ryzen AI Max+395 le premier processeur grand public capable d’exécuter GPT-OSS-120B directement sur un PC. Pour y parvenir, AMD a adopté le cadre GGML et le format de précision MXFP4, permettant une exécution fluide du modèle avec environ 61 Go de mémoire vidéo. Le plateau Strix Halo, doté d’un total de 128 Go de mémoire unifiée, alloue jusqu’à 96 Go à la GPU, satisfaisant ainsi les exigences mémoire du modèle. En termes de performance, le Ryzen AI Max+395 affiche une vitesse de sortie de 30 tokens par seconde lors de l’exécution de GPT-OSS-120B, tout en supportant le protocole de contexte MCP, ce qui améliore significativement la réactivité et l’efficacité dans les tâches complexes, comme la génération de texte ou l’analyse de données. Quant à Qualcomm, les tests préliminaires montrent que GPT-OSS-20B s’exécute avec une remarquable capacité de raisonnement en chaîne (chain-of-thought) sur les plateformes Snapdragon. Les développeurs peuvent désormais déployer ce modèle sur des appareils équipés de puces Snapdragon via des plateformes populaires comme Hugging Face ou Ollama, facilitant l’accès et l’expérimentation pour une large communauté. Cette collaboration entre AMD et Qualcomm illustre une vision stratégique partagée en matière d’IA au niveau du bord. En rendant possible l’exécution de modèles d’IA de grande taille directement sur les appareils, ces entreprises ouvrent la voie à des applications plus intelligentes, plus rapides et plus autonomes. Avec la généralisation de GPT-OSS, on peut s’attendre à une transformation profonde des écosystèmes mobiles, des PC intelligents et des dispositifs embarqués, où l’IA devient non seulement plus accessible, mais aussi plus réactive et plus personnalisée.