il y a 7 mois

DeepSeek-AI Aixin Liu Aoxue Mei Bangcai Lin Bing Xue Bingxuan Wang Bingzheng Xu Bochao Wu Bowei Zhang Chaofan Lin

Résumé

Nous présentons DeepSeek-V3.2, un modèle qui allie efficacité computationnelle élevée à des performances supérieures en raisonnement et en agenticité. Les principaux progrès techniques apportés par DeepSeek-V3.2 sont les suivants :(1) Attention Éparse DeepSeek (DSA) : Nous introduisons DSA, un mécanisme d’attention efficace qui réduit considérablement la complexité computationnelle tout en préservant les performances du modèle dans les scénarios à long contexte.(2) Cadre d’apprentissage par renforcement évolutif : Grâce à la mise en œuvre d’un protocole d’apprentissage par renforcement robuste et à l’augmentation de la puissance de calcul post-entraînement, DeepSeek-V3.2 atteint des performances comparables à celles de GPT-5. Notamment, notre variant à haute puissance de calcul, DeepSeek-V3.2-Speciale, dépasse GPT-5 et fait preuve d’un niveau de raisonnement équivalent à celui de Gemini-3.0-Pro, obtenant une performance de médaille d’or aux Olympiades internationales de mathématiques (IMO) 2025 et aux Olympiades internationales d’informatique (IOI).(3) Pipeline à grande échelle de synthèse de tâches agentic : Afin d’intégrer le raisonnement dans des scénarios d’utilisation d’outils, nous avons développé un nouveau pipeline de synthèse permettant de générer de manière systématique des données d’entraînement à grande échelle. Cette méthodologie permet un post-entraînement agentic évolutif, entraînant des améliorations significatives en généralisation et en robustesse à la suivie d'instructions dans des environnements complexes et interactifs.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

il y a 7 mois

DeepSeek-AI Aixin Liu Aoxue Mei Bangcai Lin Bing Xue Bingxuan Wang Bingzheng Xu Bochao Wu Bowei Zhang Chaofan Lin

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

il y a 7 mois

DeepSeek-AI Aixin Liu Aoxue Mei Bangcai Lin Bing Xue Bingxuan Wang Bingzheng Xu Bochao Wu Bowei Zhang Chaofan Lin

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

DeepSeek-V3.2 : Pousser les limites des modèles linguistiques à grande échelle ouverts | Articles | HyperAI

Command Palette

DeepSeek-V3.2 : Pousser les limites des modèles linguistiques à grande échelle ouverts

DeepSeek-AI Aixin Liu Aoxue Mei Bangcai Lin Bing Xue Bingxuan Wang Bingzheng Xu Bochao Wu Bowei Zhang Chaofan Lin254 more

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

DeepSeek-V3.2 : Pousser les limites des modèles linguistiques à grande échelle ouverts

DeepSeek-AI Aixin Liu Aoxue Mei Bangcai Lin Bing Xue Bingxuan Wang Bingzheng Xu Bochao Wu Bowei Zhang Chaofan Lin254 more

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

DeepSeek-V3.2 : Pousser les limites des modèles linguistiques à grande échelle ouverts

DeepSeek-AI Aixin Liu Aoxue Mei Bangcai Lin Bing Xue Bingxuan Wang Bingzheng Xu Bochao Wu Bowei Zhang Chaofan Lin254 more

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

DeepSeek-AI Aixin Liu Aoxue Mei Bangcai Lin Bing Xue Bingxuan Wang Bingzheng Xu Bochao Wu Bowei Zhang Chaofan Lin

DeepSeek-AI Aixin Liu Aoxue Mei Bangcai Lin Bing Xue Bingxuan Wang Bingzheng Xu Bochao Wu Bowei Zhang Chaofan Lin

DeepSeek-AI Aixin Liu Aoxue Mei Bangcai Lin Bing Xue Bingxuan Wang Bingzheng Xu Bochao Wu Bowei Zhang Chaofan Lin