HyperAI

Aujourd’hui, nous sommes fiers de présenter Granite 4.0 Nano, notre modèle le plus petit à ce jour, lancé dans le cadre de la famille de modèles Granite 4.0 d’IBM. Conçu spécifiquement pour les applications embarquées et les dispositifs locaux, ce modèle allie performance et compacité, illustrant ainsi l’engagement d’IBM à développer des modèles puissants et utiles, sans nécessiter des centaines de milliards de paramètres. Comme tous les modèles Granite 4.0, les versions Nano sont disponibles sous licence Apache 2.0 et bénéficient d’une prise en charge native sur des runtimes populaires tels que vLLM, llama.cpp et MLX. Les modèles Granite 4.0 Nano ont été entraînés avec les mêmes méthodologies améliorées, pipelines et plus de 15 téraoctets de données d’entraînement que ceux utilisés pour les modèles Granite 4.0 initiaux. Cette nouvelle version intègre une architecture hybride optimisée, permettant une efficacité accrue. Comme tous les modèles linguistiques Granite, les versions Nano portent la certification ISO 42001 d’IBM en matière de développement responsable des modèles, garantissant ainsi qu’ils sont conçus et gérés selon des normes mondiales. Le lancement inclut quatre modèles instructifs et leurs versions de base, tous compris entre moins d’un milliard et environ un milliard de paramètres. Ce segment, qui s’étend de quelques centaines de millions à un milliard de paramètres, est aujourd’hui très dynamique, avec des avancées significatives de la part de plusieurs acteurs comme Alibaba (Qwen), LiquidAI (LFM), Google (Gemma), et d’autres. Face à ces concurrents, les modèles Granite 4.0 Nano se distinguent par une capacité remarquable pour leur taille, démontrée par des résultats supérieurs sur plusieurs benchmarks généraux couvrant les domaines du savoir général, des mathématiques, du codage et de la sécurité. En outre, les modèles Granite Nano surpassent plusieurs modèles de taille similaire sur des tâches essentielles aux workflows agents, notamment la compréhension d'instructions et l’appel d’outils. Ces performances ont été évaluées via les benchmarks IFEval et le Berkeley Function Calling Leaderboard v3 (BFCLv3), où ils affichent des taux de précision particulièrement élevés. Pour plus de détails techniques et résultats complets, consultez les fiches modèles sur Hugging Face. À l’avenir, IBM continuera à enrichir la famille Granite 4.0, en s’efforçant de rendre l’IA plus efficace, accessible et performante pour les développeurs.

Liens associés

Liens associés

Liens associés

ByteDance Met En Open Source Lance, Un Modèle 3B Englobant La Compréhension, La Génération Et l'édition ; l'Université Nationale De Singapour Propose l'ensemble De Données ViMU : Couvrant 588 Vidéos Et Des Réponses À Des Questions Non verbales.

ByteDance Met En Open Source Lance, Un Modèle 3B Englobant La Compréhension, La Génération Et l'édition ; l'Université Nationale De Singapour Propose l'ensemble De Données ViMU : Couvrant 588 Vidéos Et Des Réponses À Des Questions Non verbales.

Command Palette

Granite 4.0 Nano : L’IA ultra-petite qui surpasse les géants

Liens associés

Command Palette

Granite 4.0 Nano : L’IA ultra-petite qui surpasse les géants

Liens associés

Command Palette

Granite 4.0 Nano : L’IA ultra-petite qui surpasse les géants

Liens associés

ByteDance Met En Open Source Lance, Un Modèle 3B Englobant La Compréhension, La Génération Et l'édition ; l'Université Nationale De Singapour Propose l'ensemble De Données ViMU : Couvrant 588 Vidéos Et Des Réponses À Des Questions Non verbales.

ByteDance Met En Open Source Lance, Un Modèle 3B Englobant La Compréhension, La Génération Et l'édition ; l'Université Nationale De Singapour Propose l'ensemble De Données ViMU : Couvrant 588 Vidéos Et Des Réponses À Des Questions Non verbales.