1. Introduction au tutoriel

Jan-v1-4B est un modèle de langage open source de 4 milliards de paramètres, publié par l'équipe Jan (JanHQ) en août 2025. Destiné au raisonnement intelligent basé sur le corps et à l'invocation d'outils, il s'agit de la première version de la famille Jan et est optimisé pour les scénarios de workflow réels dans les applications Jan. Basé sur Qwen3-4B-Thinking-2507, ce modèle a été peaufiné et étendu, atteignant une précision de 91,11 TP3T sur le benchmark SimpleQA, démontrant ainsi des améliorations significatives de performances grâce à l'extension et au réglage du modèle. La documentation officielle indique également qu'il peut surpasser certains modèles plus importants sur ce benchmark.

Ce tutoriel utilise des ressources pour une seule carte RTX 4090.

3. Étapes de l'opération

1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web

2. Après être entré sur la page Web, vous pouvez démarrer une conversation avec le modèle

Si « Modèle » n'est pas affiché, cela signifie que le modèle est en cours d'initialisation. Le modèle étant volumineux, veuillez patienter 2 à 3 minutes avant d'actualiser la page.

Comment utiliser

4. Discussion

🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓

HyperAI

Exécuter ce Notebook

Date

il y a 6 mois

Taille

1.76 MB

Balises

Traitement Du Langage Naturel

Licence

Apache 2.0

1. Introduction au tutoriel

Ce tutoriel utilise des ressources pour une seule carte RTX 4090.

2. Exemples de projets

3. Étapes de l'opération

1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web

2. Après être entré sur la page Web, vous pouvez démarrer une conversation avec le modèle

Si « Modèle » n'est pas affiché, cela signifie que le modèle est en cours d'initialisation. Le modèle étant volumineux, veuillez patienter 2 à 3 minutes avant d'actualiser la page.

Comment utiliser

4. Discussion

Ce notebook est fourni par des utilisateurs de la communauté et est destiné à des fins éducatives et informatives uniquement. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour un examen et un retrait rapides.

Associé Notebooks

Déploiement De LFM2.5-1.2B-Thinking À l'aide De vLLM Et d'une Interface Web Ouverte

il y a 8 jours

Déploiement De GLM-4.7-Flash À l'aide De vLLM+Open WebUI

il y a 8 jours

Tutoriel Sur Le Compilateur Triton

il y a 15 jours

Tutoriel TVM 0.22.0

il y a 15 jours

Déploiement En Un Clic Du Modèle SmolLM3-3B

il y a 3 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Exécuter ce Notebook

Date

il y a 6 mois

Taille

1.76 MB

Balises

Traitement Du Langage Naturel

Licence

Apache 2.0

1. Introduction au tutoriel

Ce tutoriel utilise des ressources pour une seule carte RTX 4090.

2. Exemples de projets

3. Étapes de l'opération

1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web

2. Après être entré sur la page Web, vous pouvez démarrer une conversation avec le modèle

Si « Modèle » n'est pas affiché, cela signifie que le modèle est en cours d'initialisation. Le modèle étant volumineux, veuillez patienter 2 à 3 minutes avant d'actualiser la page.

Comment utiliser