تشغيل CogVLM2-Llama3-Chinese-Chat-19B عبر الإنترنت
مقدمة النموذج
بالمقارنة مع نموذج المصدر المفتوح CogVLM من الجيل السابق، فإن نموذج المصدر المفتوح لسلسلة CogVLM2 يحتوي على التحسينات التالية:
- تحسينات كبيرة على العديد من المعايير، مثل TextVQA، وDocVQA.
- يدعم محتوى بطول 8K.
- يدعم دقة الصورة حتى 1344*1344.
- يتم توفير نسخة نموذجية مفتوحة المصدر، تدعم اللغتين الصينية والإنجليزية.
كيفية الركض
- افتح صفحة طرفية جديدة
- أدخل الأمر
cd CogVLM2/basic_demo
chainlit run web_demo.py --port 8080
تشغيل البرنامج
- انسخ عنوان API الموجود على اليمين وافتحه في متصفحك
- انقر أدناه لتحميل صورة وأدخل النص المطلوب

- اضغط على Enter لتوليد الإجابة
