HyperAI

تشغيل النسخة التجريبية من Cambrian-1 عبر الإنترنت

Cambrian-1 عبارة عن عائلة من LLMs متعددة الوسائط (MLLMs) المصممة بنهج يركز على الرؤية. في حين أن نماذج اللغة القوية يمكن أن تعزز القدرات المتعددة الوسائط، فإن خيارات تصميم المكون المرئي غالبًا ما تكون غير مستكشفة وغير متوافقة مع أبحاث التعلم التمثيلي البصري.

تم بناء Cambrian-1 حول خمسة ركائز أساسية، يوفر كل منها رؤى مهمة في مجال تصميم شركات التسويق متعدد المستويات:

  • التمثيل البصري: قام فريق البحث باستكشاف العديد من المشفرات البصرية ومجموعاتها.
  • تصميم الموصل: قام فريق البحث بتصميم موصل ديناميكي جديد وواعٍ مكانيًا يدمج الميزات المرئية من عدة نماذج مع تقليل عدد الرموز.
  • بيانات ضبط التعليمات: يقوم فريق البحث بجمع بيانات ضبط التعليمات المرئية عالية الجودة من الموارد العامة، مع التركيز على أهمية التوزيع المتوازن.
  • كتاب طبخ ضبط التعليمات: يناقش فريق البحث استراتيجيات وممارسات ضبط التعليمات.
  • المعايير: قام فريق البحث بفحص معايير التسويق متعدد المستويات الحالية وقدم معيارًا جديدًا يركز على الرؤية "CV-Bench".

موقع مشروع كامبريان-1:https://cambrian-mllm.github.io/#visual-representation

أداء النموذج

نموذج# مرئي. توك.إم إم بيضمان الجودة الأولماثفيستامتشارت كيو ايهMMVP
جي بي تي-4 فيجامعة نورث كارولينا75.849.978.550.0
جيميني-1.0 بروجامعة نورث كارولينا73.645.2
جيميني-1.5 بروجامعة نورث كارولينا52.181.3
جروك-1.5جامعة نورث كارولينا52.876.1
MM-1-8B14472.372.635.9
MM-1-30B14475.181.039.4
ماجستير القانون الأساسي: LLaMA3-8B-Instruct
ميني-جيميني-HD-8B288072.775.137.059.118.7
LLaVA-NeXT-8B288072.172.836.369.538.7
الكمبري-1-8ب57675.980.449.073.351.3
ماجستير القانون الأساسي: فيكونا 1.5-13ب
ميني-جيميني-HD-13B288068.671.937.056.619.3
LLaVA-NeXT-13B288070.073.535.162.236.0
الكمبري-1-13ب57675.779.348.073.841.3
قاعدة ماجستير القانون: Hermes2-Yi-34B
ميني-جيميني-HD-34B288080.677.743.467.637.3
LLaVA-NeXT-34B288079.381.846.568.747.3
الكمبري-1-34ب57681.485.653.275.652.7

نشر خطوة الاستدلال

لقد قام هذا البرنامج التعليمي بنشر النموذج والبيئة. يمكنك استخدام النموذج الكبير مباشرةً للحوار المنطقي وفقًا لإرشادات البرنامج التعليمي. البرنامج التعليمي المحدد هو كما يلي:

1. الإعداد الأولي

1. افتح مساحة العمل بعد تكوين الموارد

1

2. افتح المحطة وأدخل الأمر bash setup.sh

2

3. بعد أن يقوم النظام بإخراج متغير البيئة المضاف إلى .bashrc، أدخل الأمر source ~/.bashrc


2. ابدأ تشغيل وحدة التحكم

4. بعد اكتمال التهيئة، أدخل الأمر في المحطة الطرفية bash control.sh

3

3. افتح الواجهة

5. انتظر لمدة 15 ثانية تقريبًا ثم افتحمحطة جديدة، وأدخل الأمر bash gradio.shانقر على الرابط الذي تم إنشاؤه في الصفحة للدخول إلى واجهة النموذج

6. في هذا الوقت، لاحظ أنه لا يوجد نموذج يمكننا اختياره في واجهة النموذج. وذلك لأننا لم نقم بتكوين النموذج بعد. في هذه المرحلة، الخطوة الرابعة مطلوبة.


4. تكوين النموذج

7. افتح آخرمحطة جديدة وأدخل الأمر bash model.sh . عندما يظهر "Uvicorn قيد التشغيل على ..."، ارجع إلى واجهة الويب المفتوحة لـ Gradio وقم بتحديثها للتأكد من نشر النموذج. يمكنك بعد ذلك تحميل الصور والمطالبات للتحدث مع النموذج.

يوجد أيضًا العديد من المعلمات في النموذج والتي يمكن للمستخدم تعديلها.

  • يمكن أن تؤثر درجة الحرارة على الإبداع والعشوائية في المحتوى الناتج.
  • يمكن لـ Top p التحكم في حجم مجموعة الكلمات المرشحة، مما يؤثر على جودة وتنوع النص الناتج
  • يمكن لرموز الإخراج القصوى تغيير العدد الأقصى لرموز الإخراج.