Exécutez CogVLM2-Llama3-Chinese-Chat-19B En Ligne
Présentation du modèle
Par rapport au modèle open source CogVLM de la génération précédente, le modèle open source de la série CogVLM2 présente les améliorations suivantes :
- Améliorations significatives sur de nombreux benchmarks, tels que TextVQA, DocVQA.
- Prend en charge une longueur de contenu de 8K.
- Prend en charge une résolution d'image jusqu'à 1344*1344.
- Une version de modèle open source est fournie, prenant en charge le chinois et l'anglais.
Comment courir
- Ouvrir une nouvelle page de terminal
- Entrez la commande
cd CogVLM2/basic_demo
chainlit run web_demo.py --port 8080
Exécuter le programme
- Copiez l'adresse API à droite et ouvrez-la dans votre navigateur
- Cliquez ci-dessous pour télécharger une image et saisir le texte d'invite

- Appuyez sur Entrée pour générer la réponse
