HyperAIHyperAI

Command Palette

Search for a command to run...

Déploiement En Un Clic De Qwen3-4B-2507

Date

il y a 5 mois

Size

1.72 MB

Tags

License

Apache 2.0

Paper URL

2505.09388

1. Introduction au tutoriel

Étoiles GitHub

Qwen3-4B-Thinking-2507 et Qwen3-4B-Instruct-2507 sont deux grands modèles de langage lancés par l'équipe Tongyi Qianwen d'Alibaba en août 2025. En termes de performances, Qwen3-4B-Thinking-2507 surpasse nettement les modèles Qwen3 plus petits de taille similaire dans le raisonnement sur des problèmes complexes, les capacités mathématiques et de programmation, ainsi que les appels de fonctions multiples. Dans le domaine non lié au raisonnement, Qwen3-4B-Instruct-2507 surpasse largement le modèle propriétaire GPT-4.1-nano en termes de connaissances, de raisonnement, de programmation, d'alignement et d'autonomie, et ses performances sont proches de celles du modèle de taille moyenne Qwen3-30B-A3B (hors raisonnement). Ce modèle couvre un plus large éventail de connaissances linguistiques, améliore l'alignement avec les préférences humaines dans les tâches subjectives et ouvertes, et peut fournir des réponses plus pertinentes. Les résultats des articles associés sont… Rapport technique Qwen3 .

Ce tutoriel utilise des ressources RTX 4090 à double carte.

2. Exemples de projets

Qwen3-4B-Pensée-2507 

Qwen3-4B-Instruct-2507 

3. Étapes de l'opération

1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web

2. Après être entré sur la page Web, vous pouvez démarrer une conversation avec le modèle

Si « Modèle » n'est pas affiché, cela signifie que le modèle est en cours d'initialisation. Le modèle étant volumineux, veuillez patienter 2 à 3 minutes avant d'actualiser la page.

Comment utiliser

Qwen3-4B-Pensée-2507

Qwen3-4B-Instruct-2507

4. Discussion

🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓

Informations sur la citation

Les informations de citation pour ce projet sont les suivantes :

@misc{qwen3technicalreport,
      title={Qwen3 Technical Report}, 
      author={Qwen Team},
      year={2025},
      eprint={2505.09388},
      archivePrefix={arXiv},
      primaryClass={cs.CL},
      url={https://arxiv.org/abs/2505.09388}, 
}

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Déploiement En Un Clic De Qwen3-4B-2507 | Notebooks | HyperAI