HyperAIHyperAI

Command Palette

Search for a command to run...

K2-V2 : Un LLM à ouverture 360°, renforcé par le raisonnement

Abstract

Nous présentons K2-V2, un modèle linguistique à très grande échelle (LLM) entièrement open-source à 360 degrés, conçu de zéro comme une base supérieure pour l’adaptation au raisonnement, en complément de fonctions telles que la conversation et la récupération de connaissances, propres aux LLM généraux. Il constitue le modèle entièrement open-source le plus puissant à ce jour, rivalisant avec les leaders du domaine à sa taille, surpassant Qwen2.5-72B et s’approchant de la performance de Qwen3-235B. Nous intégrons activement, tout au long du processus d’entraînement, des connaissances spécialisées, des capacités de raisonnement, la gestion de contextes longs et l’utilisation d’outils, préparant explicitement le modèle à des tâches de raisonnement complexes. Nous démontrons ce potentiel grâce à une simple fine-tuning supervisée, établissant ainsi une base solide qui laisse apparaître un fort potentiel d’amélioration par des méthodes d’alignement avancées. En publiant l’intégralité de l’historique d’entraînement ainsi que la composition des données, nous maximisons l’efficacité de l’entraînement continu, scénario clé dans la production open-source. Nous mettons à disposition les poids du modèle ainsi que des artefacts emblématiques du LLM360, notamment l’ensemble complet des données d’entraînement, afin d’offrir à la communauté une base performante, centrée sur le raisonnement.


Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
K2-V2 : Un LLM à ouverture 360°, renforcé par le raisonnement | Papers | HyperAI