HyperAIHyperAI

Command Palette

Search for a command to run...

Microsoft lance trois nouveaux modèles IA

Microsoft AI, le laboratoire de recherche de la géante technologique, a annoncé le lancement jeudi de trois nouveaux modèles d'intelligence artificielle fondamentale capables de générer du texte, de la voix et des images. Cette initiative marque une accélération de la stratégie de Microsoft pour développer sa propre pile de modèles multimodaux afin de rivaliser avec les autres laboratoires d'IA, tout en maintenant son partenariat stratégique avec OpenAI. Ces nouveaux outils, développés par l'équipe Superintelligence de Microsoft dirigée par le PDG Microsoft AI, Mustafa Suleyman, comprennent MAI-Transcribe-1, MAI-Voice-1 et MAI-Image-2. Le modèle de transcription, MAI-Transcribe-1, convertit la parole en texte dans 25 langues différentes. Il est déclaré deux fois et demi plus rapide que l'offre Azure Fast existante de Microsoft. Le modèle de synthèse vocale, MAI-Voice-1, permet de générer 60 secondes d'audio en seulement une seconde et offre la possibilité de créer des voix personnalisées. Enfin, MAI-Image-2 est un modèle de génération vidéo. Auparavant disponibles uniquement sur MAI Playground, une nouvelle plateforme de test de grands modèles de langage lancée le 19 mars, ces trois modèles sont désormais accessibles sur Microsoft Foundry. Les modèles de transcription et de voix restent également disponibles sur MAI Playground. Mustafa Suleyman a souligné dans un billet de blog que Microsoft s'efforce de construire une « IA humaniste », centrée sur les besoins réels de communication des utilisateurs et optimisée pour des cas d'usage pratiques. Il a promis l'arrivée future de davantage de modèles dans les produits Microsoft. Dans un marché de modèles de langage en forte croissance, Microsoft mise sur un avantage concurrentiel majeur : un prix plus compétitif que ceux de ses rivaux Google et OpenAI. MAI-Transcribe-1 commence à 0,36 dollar par heure de transcription. MAI-Voice-1 est proposé à 22 dollars par million de caractères générés. MAI-Image-2 coûte 5 dollars pour un million de tokens d'entrée texte et 33 dollars pour un million de tokens de sortie d'image. Malgré le déploiement de ses propres modèles, Mustafa Suleyman a réaffirmé l'engagement de Microsoft envers son partenariat avec OpenAI lors d'une interview avec VentureBeat. Cependant, une récente renégociation de cet accord a permis à Microsoft de mener ses propres recherches sur l'intelligence surhumaine, comme l'a confirmé Suleyman à The Verge. Microsoft a investi plus de 13 milliards de dollars dans ce laboratoire de recherche. À l'instar de sa stratégie concernant les puces électroniques, l'entreprise adopte une approche hybride, produisant ses propres technologies tout en continuant à acheter des solutions externes pour enrichir son écosystème.

Liens associés