Nouveau modèle AI Phi 4 de Microsoft rivalise avec les plus gros systèmes.
Microsoft a lancé plusieurs nouveaux modèles d'IA « ouverts » mercredi, dont le plus performant est compétitif avec l'o3-mini d'OpenAI sur au moins un benchmark. Ces modèles de la famille Phi-4, dédiés aux tâches de raisonnement, marquent une avancée significative dans le domaine des petits modèles linguistiques (SLMs). Alors que les grands modèles de langage (LLMs) ont dominé les actualités récemment, ces SLMs montrent qu'une performance exceptionnelle ne nécessite pas toujours des ressources colossales. Les modèles Phi-4 mini reasoning, Phi-4 reasoning, et Phi-4 reasoning plus sont spécifiquement conçus pour des tâches de raisonnement complexes. Phi-4 mini reasoning, avec environ 3,8 milliards de paramètres, a été formé sur environ 1 million de problèmes mathématiques synthétiques générés par le modèle R1 de l'entreprise chinoise DeepSeek. Microsoft affirme que ce modèle est idéal pour des applications éducatives, comme du tutorat intégré sur des appareils légers. Phi-4 reasoning, doté de 14 milliards de paramètres, a été formé à partir de données web de haute qualité et de démonstrations curées provenant de l'o3-mini d'OpenAI. Il est particulièrement adapté aux applications en mathématiques, sciences et codage. L'un des points forts de ce modèle est sa capacité à générer des chaînes de raisonnement détaillées, permettant de résoudre des problèmes complexes en plusieurs étapes. Phi-4 reasoning plus est une version améliorée de Phi-4 reasoning, obtenue grâce à des techniques d'apprentissage par renforcement (RL). Cette variante offre une précision accrue, atteignant des performances comparables à celles de modèles beaucoup plus gros, tels que le DeepSeek-R1 Mixture-of-Experts de 671 milliards de paramètres. Ces modèles ont été évalués sur une série de benchmarks rigoureux, montrant des résultats impressionnants. Par exemple, sur des tâches de raisonnement mathématique, le Phi-4 reasoning et le Phi-4 reasoning plus surpassent non seulement le modèle de base Phi-4, mais aussi des modèles ouverts de poids plus lourd, comme le DeepSeek-R1-Distill-Llama-70B. Ils obtiennent également d'excellents scores sur des évaluations de niveau doctorat en sciences, des tests de compréhension du langage comme MMLUPro, des benchmarks de codage comme HumanEvalPlus, et des évaluations générales de compétences comme ArenaHard. Le Phi-4 mini reasoning, malgré sa taille compacte, se distingue également sur des benchmarks populaires de mathématiques, telles que MATH et GPQA Diamond, surpassant même des modèles plus lourds de 7 et 8 milliards de paramètres. Ces modèles sont disponibles sur la plateforme de développement d'IA Hugging Face, accompagnés de rapports techniques détaillés. Microsoft souligne que ces modèles, grâce à des techniques de distillation, d'apprentissage par renforcement et à des données de haute qualité, équilibrent efficacement la taille et les performances, rendant possible l'exécution de tâches de raisonnement complexes sur des appareils ayant des ressources limitées. Pour faciliter l'accès à ces modèles, Microsoft les propose dans le catalogue des modèles d'Azure AI. Les développeurs peuvent les déployer sous forme d'endpoints d'API sans serveur, ce qui simplifie l'intégration de ces capacités de raisonnement avancées dans leurs applications sans avoir à gérer l'infrastructure sous-jacente. L'utilisation du SDK Python azure-ai-inference est l'une des méthodes les plus simples pour interagir avec ces modèles. Des exemples de code sont fournis pour installer le SDK, exécuter des conversations multi-tours, et diffuser la sortie en temps réel pour une meilleure expérience utilisateur. Les applications potentielles de ces modèles sont nombreuses et diversifiées. Ils peuvent alimenter des agents AI capables d'automatiser des flux de travail complexes, de performer des recherches sophistiquées, ou de gérer des tâches de planification requérant une décomposition logique et une exécution précise. Dans le domaine éducatif, Phi-4 mini reasoning est particulièrement bien adapté pour des systèmes de tutorat intégrés, offrant des conseils étape par étape et des retours personnalisés en mathématiques et en logique. En développement de logiciels, leur forte performance en codage les rend utiles comme assistants puissants, capables de comprendre des logiques complexes, de générer des extraits de code, de déboguer, et d'aider à la résolution de problèmes algorithmiques. En recherche, analyse de données et ingénierie, ils peuvent aider les professionnels à aborder des calculs, simulations, et génération d'hypothèses complexes. Enfin, Phi-4 mini reasoning, associé à des optimisations comme Phi Silica pour les unités de traitement神经 (NPU) de Windows, ouvre la voie à des expériences AI plus puissantes directement sur les ordinateurs personnels et les appareils mobiles, permettant des fonctionnalités telles que la résumation hors ligne, l'intelligence textuelle avancée, et des assistants locaux plus sophistiqués qui n'ont pas besoin de se connecter constamment au cloud. L'impact plus large de la famille Phi-4 de modèles de raisonnement réside dans la démocratisation de l'accès à des capacités de raisonnement avancées. En offrant ces performances dans des modèles de taille plus réduite, Microsoft encourage l'innovation dans de nombreux domaines, permettant aux développeurs de créer des applications plus intelligentes qui s'exécutent efficacement sur une variété plus large de matériel. Microsoft est reconnu pour ses avancées technologiques et son engagement dans l'IA, contribuant activement à l'écosystème de développement d'IA en mettant à disposition des modèles performants et flexibles. La famille Phi-4 de modèles de raisonnement représente une étape cruciale dans l'évolution de l'IA, montrant que la taille n'est pas toujours un déterminant de la performance. Ces modèles ouvrent de nouvelles perspectives pour des applications nécessitant des capacités de raisonnement avancées, tout en restant accessibles et efficaces sur des appareils à ressources limitées. Microsoft a lancé plusieurs nouveaux modèles d'IA « ouverts » mercredi, dont le plus performant est compétitif avec l'o3-mini d'OpenAI. Ces modèles, qui font partie de la famille Phi-4, sont spécialement conçus pour des tâches de raisonnement complexes. Grâce à des techniques de distillation, d'apprentissage par renforcement, et à des données de haute qualité, ils équilibrent la taille et les performances, permettant l'exécution de tâches de raisonnement avancées sur des appareils à ressources limitées. Disponibles sur Hugging Face et Azure, ces modèles promettent une utilisation diversifiée dans les domaines de l'automatisation, de l'éducation, du développement de logiciels, et de la recherche scientifique, marquant une avancée significative dans le domaine des petits modèles linguistiques.
