HyperAI

تشغيل CogVLM2-Llama3-Chinese-Chat-19B عبر الإنترنت

مقدمة النموذج

بالمقارنة مع نموذج المصدر المفتوح CogVLM من الجيل السابق، فإن نموذج المصدر المفتوح لسلسلة CogVLM2 يحتوي على التحسينات التالية:

  • تحسينات كبيرة على العديد من المعايير، مثل TextVQA، وDocVQA.
  • يدعم محتوى بطول 8K.
  • يدعم دقة الصورة حتى 1344*1344.
  • يتم توفير نسخة نموذجية مفتوحة المصدر، تدعم اللغتين الصينية والإنجليزية.

كيفية الركض

  1. افتح صفحة طرفية جديدة
  2. أدخل الأمر
cd CogVLM2/basic_demo
chainlit run web_demo.py --port 8080

تشغيل البرنامج

  1. انسخ عنوان API الموجود على اليمين وافتحه في متصفحك 
  2. انقر أدناه لتحميل صورة وأدخل النص المطلوب
  1. اضغط على Enter لتوليد الإجابة