Déploiement En Un Clic De DeepSeek-R1-0528-Qwen3-8B
1. Introduction au tutoriel
Les ressources informatiques utilisées dans ce tutoriel sont une seule carte RTX 4090.
DeepSeek-R1-0528-Qwen3-8B a été publié par l'équipe DeepSeek en mai 2025. Il s'agit d'un modèle de raisonnement léger formé sur la base de la technologie de distillation de chaîne de pensée de DeepSeek-R1-0528. Le modèle comporte 8 milliards de paramètres. En distillant les capacités de raisonnement complexes de DeepSeek-R1-0528 sur le modèle de base plus petit Qwen3-8B, il combine les capacités multilingues de Qwen3 et l'optimisation du raisonnement de DeepSeek-R1. Ses performances sont comparables à celles du GPT-4 et il prend en charge un déploiement efficace sur une seule carte, ce qui en fait un choix idéal pour les applications académiques et d'entreprise. Lors de l'AIME 2024, DeepSeek-R1-0528-Qwen3-8B a obtenu les meilleures performances (SOTA) parmi les modèles open source, surpassant Qwen3 8B +10.0% et comparable aux performances de Qwen3-235B-thinking.
2. Exemples de projets

3. Étapes de l'opération
1. Démarrez le conteneur
Si « Modèle » n'est pas affiché, cela signifie que le modèle est en cours d'initialisation. Étant donné que le modèle est grand, veuillez patienter environ 2 à 3 minutes et actualiser la page.

2. Après être entré sur la page Web, vous pouvez démarrer une conversation avec le modèle

4. Discussion
🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓

Informations sur la citation
Les informations de citation pour ce projet sont les suivantes :
@misc{deepseekai2025deepseekr1incentivizingreasoningcapability,
title={DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning},
author={DeepSeek-AI},
year={2025},
eprint={2501.12948},
archivePrefix={arXiv},
primaryClass={cs.CL},
url={https://arxiv.org/abs/2501.12948},
}