HyperAIHyperAI

Command Palette

Search for a command to run...

DeepSeek-V3.2 : Pousser les limites des modèles linguistiques à grande échelle ouverts

Abstract

Nous présentons DeepSeek-V3.2, un modèle qui allie efficacité computationnelle élevée à des performances supérieures en raisonnement et en agenticité. Les principaux progrès techniques apportés par DeepSeek-V3.2 sont les suivants :(1) Attention Éparse DeepSeek (DSA) : Nous introduisons DSA, un mécanisme d’attention efficace qui réduit considérablement la complexité computationnelle tout en préservant les performances du modèle dans les scénarios à long contexte.(2) Cadre d’apprentissage par renforcement évolutif : Grâce à la mise en œuvre d’un protocole d’apprentissage par renforcement robuste et à l’augmentation de la puissance de calcul post-entraînement, DeepSeek-V3.2 atteint des performances comparables à celles de GPT-5. Notamment, notre variant à haute puissance de calcul, DeepSeek-V3.2-Speciale, dépasse GPT-5 et fait preuve d’un niveau de raisonnement équivalent à celui de Gemini-3.0-Pro, obtenant une performance de médaille d’or aux Olympiades internationales de mathématiques (IMO) 2025 et aux Olympiades internationales d’informatique (IOI).(3) Pipeline à grande échelle de synthèse de tâches agentic : Afin d’intégrer le raisonnement dans des scénarios d’utilisation d’outils, nous avons développé un nouveau pipeline de synthèse permettant de générer de manière systématique des données d’entraînement à grande échelle. Cette méthodologie permet un post-entraînement agentic évolutif, entraînant des améliorations significatives en généralisation et en robustesse à la suivie d'instructions dans des environnements complexes et interactifs.


Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp