HyperAIHyperAI

Command Palette

Search for a command to run...

JetBrains lance le modèle Mellum2 de 12B

JetBrains a officiellement lancé Mellum2, un modèle d'intelligence artificielle de type Mixture-of-Experts pesant 12 milliards de paramètres, entraîné entièrement à partir de zéro sur des corpus de langage naturel et de code. Annoncé récemment, ce modèle se distingue par son architecture efficace qui n'active que 2,5 milliards de paramètres à la fois par jeton généré. Cette caractéristique permet une inférence rapide et peu coûteuse, idéale pour des tâches exigeant un débit élevé et une faible latence. Contrairement à de nombreux modèles contemporains orientés vers la multimodalité, Mellum2 se concentre exclusivement sur le texte et le code pour garantir une compacité maximale et une performance optimale dans le domaine de l'ingénierie logicielle. Le modèle est disponible sous licence Apache 2.0, ce qui facilite son utilisation et sa modification. Selon les évaluations techniques publiées par JetBrains, Mellum2 offre des performances compétitives par rapport à d'autres modèles de taille similaire, tout en étant plus de deux fois plus rapide pour l'inférence. Cette amélioration significative de la vitesse rend le modèle particulièrement adapté aux environnements de production où la réactivité est cruciale. Les benchmarks couvrent des domaines variés incluant la génération de code, le raisonnement, les sciences et les mathématiques. JetBrains conçoit Mellum2 comme un composant « focal » au sein d'architectures d'IA modernes, qui reposent de plus en plus sur l'appel simultané de plusieurs modèles spécialisés plutôt que sur une seule entité monolithique. Le modèle est spécifiquement destiné à des opérations sensibles à la latence qui ne nécessitent pas la puissance d'un modèle géant. Parmi ses cas d'utilisation principaux figurent le routage et l'orchestration, où Mellum2 peut classifier les requêtes, sélectionner des outils ou gérer les flux de contrôle intermédiaires. Il s'avère également très efficace pour les pipelines de recherche et de génération augmentées par l'IA (RAG), notamment pour la compression du contexte, la résumation et le traitement post-recherche. De plus, le modèle peut agir comme un sous-agent pour des tâches de planification, de validation ou de préparation de contexte, permettant de réduire la dépendance aux modèles plus lourds pour les opérations intermédiaires. Sa nature open source et son efficacité de calcul facilitent également son déploiement dans des environnements privés ou en auto-hébergement, protégeant ainsi les données propriétaires ou confidentielles. L'objectif de JetBrains n'est pas de remplacer les modèles de pointe, mais d'optimiser la pile technologique globale pour la rendre plus rapide, moins coûteuse et plus facile à contrôler. Les développeurs intéressés peuvent télécharger le modèle sur Hugging Face et consulter le rapport technique détaillé pour approfondir les informations sur l'architecture, les méthodes d'entraînement et les résultats des évaluations.

Liens associés

JetBrains lance le modèle Mellum2 de 12B | Articles tendance | HyperAI