HyperAI
Back to Headlines

Mistral lance Voxtral, son premier modèle audio IA open source pour entreprises

il y a 2 jours

Le mardi, Mistral, une startup française spécialisée en intelligence artificielle, a annoncé le lancement de Voxtral, sa première série de modèles audio destinés aux entreprises. Cette initiative vise à combattre l'hégémonie des systèmes corporatifs verrouillés grâce à des alternatives à code ouvert. Une Alternative Ouverte et Performante Avec l'évolution constante des systèmes d'IA, le langage parlé est de plus en plus utilisé pour communiquer avec les machines. Jusqu'à présent, les développeurs étaient confrontés à un dilemme : choisir entre un système ouvert et peu coûteux, mais imparfait en matière de transcription et compréhension, et un système fermé et performant, mais beaucoup plus cher et limité en termes de contrôle. Voilà où intervient Voxtral, présenté par Mistral comme le premier modèle ouvert capable de déployer une vraie intelligence de parole opérationnelle. Performance et Économies Voxtral offre aux entreprises une option abordable, revendiquée par Mistral comme étant inférieure à la moitié du prix des solutions concurrentes. Ce modèle peut transcrire jusqu'à 30 minutes d'audio et, grâce à son noyau basé sur un grand modèle linguistique (LLM), il peut comprendre jusqu'à 40 minutes de contenu audio. Les utilisateurs peuvent ainsi poser des questions sur le contenu audio, générer des résumés, ou exécuter des commandes vocales en temps réel, telles que des appels d'API ou l'exécution de fonctions. De plus, Voxtral est multilingue, capable de transcrire et de comprendre des langues comme l'anglais, l'espagnol, le français, le portugais, l'hindi, l'allemand, le néerlandais et l'italien. Variants de Modèles Mistral propose deux variantes de ses modèles de compréhension vocale : 1. Voxtral Small : doté de 24 milliards de paramètres, ce modèle est conçu pour des déploiements à grande échelle et se compare favorablement à ElevenLabs Scribe, GPT-4o-mini, et Gemini 2.5 Flash. 2. Voxtral Mini : avec 3 milliards de paramètres, ce modèle est destiné aux déploiements locaux et aux périphériques embarqués. Il existe également une version optimisée pour la transcription uniquement, appelée Voxtral Mini Transcribe, qui assure une rapidité et des performances supérieures à celles d'OpenAI Whisper, et ce pour moins de la moitié du coût. Accessibilité et Intégration Les utilisateurs peuvent tester Voxtral gratuitement en téléchargeant l'API sur la plateforme Hugging Face ou en essayant les modèles via le chatbot de Mistral, Le Chat. L'intégration de l'API dans des applications commence à 0,001 dollar par minute, selon les informations de la société. Contexte Historique et Perspective Ce lancement intervient un mois après que Mistral a révélé Magistral, sa première série de modèles de raisonnement capables de résoudre des problèmes étape par étape, améliorant ainsi la fiabilité. La startup, l'un des leaders européens dans le domaine de l'IA, est reconnue pour sa forte implication dans la promotion des modèles d'IA à code ouvert. Récemment, TechCrunch a rapporté que Mistral est en discussion pour lever jusqu'à 1 milliard de dollars auprès d'investisseurs tels que le fond MGX d'Abu Dhabi, ce qui pourrait renforcer considérablement sa position sur le marché de l'IA. Impact et Perspectives La sortie de Voxtral marque une étape importante pour Mistral dans sa mission de rendre l'IA plus accessible et moins dépendante des monopoles technologiques. En offrant des solutions performantes à moindre coût, l'entreprise contribue à democratiquer les technologies audio intelligents, ouvrant de nouvelles opportunités pour les entreprises de toutes tailles et pour divers secteurs d'activité. En résumé, grâce à Voxtral, Mistral continue de défendre les avantages des modèles d'IA à code ouvert, proposant une solution audio performante et abordable qui pourrait bien révolutionner la façon dont les entreprises interagissent avec la technologie.

Related Links