Mellum-4b-base est un modèle de langage étendu (LLM) open source lancé par JetBrains le 29 avril 2025, conçu pour les tâches de compréhension, de génération et d'optimisation de code. Ce modèle démontre des capacités exceptionnelles dans l'ensemble du processus de développement logiciel et convient à des scénarios tels que la programmation améliorée par l'IA, l'intégration intelligente d'IDE, le développement d'outils pédagogiques et la recherche de code.
Ce tutoriel utilise une seule carte RTX 4090 comme ressource, et le modèle est uniquement utilisé pour optimiser le code.
2. Exemples de projets
3. Étapes de l'opération
1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web
Si « Bad Gateway » s'affiche, cela signifie que le modèle est en cours d'initialisation. Étant donné que le modèle est grand, veuillez patienter environ 1 à 2 minutes et actualiser la page.
2. Après être entré sur la page Web, vous pouvez démarrer une conversation avec le modèle
Comment utiliser
4. Discussion
🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓
Informations sur la citation
Les informations de citation pour ce projet sont les suivantes :
@misc{Mellum-4b-base,
title= {Mellum-4b-base},
author= {Pavlichenko, Nikita and Nazarov, Iurii and Dolgov, Ivan and Garanina, Ekaterina and Lasocki, Karol and Reshetnikova, Julia and Boitsov, Sergei and Bondyrev, Ivan and Karaeva, Dariia and Sheptyakov, Maksim and Ustalov, Dmitry and Mukhin, Artem and Proshev, Semyon and Abramov, Nikita and Kolomyttseva, Olga and Lysaniuk, Kseniia and Zavidnyi, Ilia and Semenkin, Anton and Tankov, Vladislav and Sazanovich, Uladzislau},
year= {2025},
}