Déploiement vLLM + Open WebUI janvier-v1-4B
1. Introduction au tutoriel
Jan-v1-4B est un modèle de langage open source de 4 milliards de paramètres, publié par l'équipe Jan (JanHQ) en août 2025. Destiné au raisonnement intelligent basé sur le corps et à l'invocation d'outils, il s'agit de la première version de la famille Jan et est optimisé pour les scénarios de workflow réels dans les applications Jan. Basé sur Qwen3-4B-Thinking-2507, ce modèle a été peaufiné et étendu, atteignant une précision de 91,11 TP3T sur le benchmark SimpleQA, démontrant ainsi des améliorations significatives de performances grâce à l'extension et au réglage du modèle. La documentation officielle indique également qu'il peut surpasser certains modèles plus importants sur ce benchmark.
Ce tutoriel utilise des ressources pour une seule carte RTX 4090.
2. Exemples de projets

3. Étapes de l'opération
1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web

2. Après être entré sur la page Web, vous pouvez démarrer une conversation avec le modèle
Si « Modèle » n'est pas affiché, cela signifie que le modèle est en cours d'initialisation. Le modèle étant volumineux, veuillez patienter 2 à 3 minutes avant d'actualiser la page.
Comment utiliser

4. Discussion
🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓
