Déploiement En Un Clic De Qwen3-4B-2507
1. Introduction au tutoriel

Qwen3-4B-Thinking-2507 et Qwen3-4B-Instruct-2507 sont des modèles de langage de grande taille lancés par l'équipe Alibaba Tongyi Qianwen en août 2025. En termes de performances, Qwen3-4B-Thinking-2507 surpasse significativement les petits modèles Qwen3 de même taille en termes de capacité de raisonnement sur des problèmes complexes, de compétences mathématiques, de capacité de codage et de capacité d'appel de fonctions multi-tours. Dans le domaine non-raisonnemental, Qwen3-4B-Instruct-2507 surpasse largement le modèle fermé de petite taille GPT-4.1-nano en termes de connaissances, de raisonnement, de programmation, d'alignement et d'agence, et se rapproche des performances du modèle de taille moyenne Qwen3-30B-A3B (non-pensant). Ce modèle couvre une plus grande connaissance des langues à longue traîne, présente une meilleure adéquation avec les préférences humaines dans les tâches subjectives et ouvertes, et peut fournir des réponses plus adaptées aux besoins. Les résultats de l'article sont les suivants :Rapport technique Qwen3".
Ce tutoriel utilise des ressources RTX 4090 à double carte.
2. Exemples de projets
Qwen3-4B-Pensée-2507

Qwen3-4B-Instruct-2507

3. Étapes de l'opération
1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web

2. Après être entré sur la page Web, vous pouvez démarrer une conversation avec le modèle
Si « Modèle » n'est pas affiché, cela signifie que le modèle est en cours d'initialisation. Le modèle étant volumineux, veuillez patienter 2 à 3 minutes avant d'actualiser la page.
Comment utiliser
Qwen3-4B-Pensée-2507

Qwen3-4B-Instruct-2507

4. Discussion
🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓

Informations sur la citation
Les informations de citation pour ce projet sont les suivantes :
@misc{qwen3technicalreport,
title={Qwen3 Technical Report},
author={Qwen Team},
year={2025},
eprint={2505.09388},
archivePrefix={arXiv},
primaryClass={cs.CL},
url={https://arxiv.org/abs/2505.09388},
}