الملخص

نُقدِّم نموذج InternLM-XComposer-2.5 (IXC-2.5)، وهو نموذج متعدد الاستخدامات لغة-صورة ذكي بحجم كبير، يدعم إدخالاً وناتجاً بسياق طويل. يُظهر IXC-2.5 أداءً متميزاً في مهام متعددة تتعلق بفهم وتركيب النصوص والصور، ويحقق قدرات تُقاس بمستوى GPT-4V، وباستخدام نموذج لغة خلفي (LLM) بحجم 7B فقط. تم تدريبه على 24 ألف سياق مُتداخل من النصوص والصور، ويمكنه التمديد السلس إلى سياقات طويلة تصل إلى 96 ألف وحدة باستخدام تقنية استخلاص RoPE. تُمكّن هذه القدرة على التعامل مع السياقات الطويلة IXC-2.5 من التفوق في المهام التي تتطلب مدخلات ونواتج بسياق واسع. مقارنةً بالإصدار السابق 2.0، يُقدِّم InternLM-XComposer-2.5 ثلاث تحسينات رئيسية في فهم اللغة والصورة: (1) فهم دقيق للدقة العالية في الصور، (2) فهم دقيق للفيديوهات، و(3) محادثة متعددة الدورات متعددة الصور. وبالإضافة إلى قدرات الفهم، يمتد IXC-2.5 إلى تطبيقيْن مُلهمين باستخدام معلمات LoRA إضافية لتكوين النصوص والصور: (1) تصميم صفحات الويب، و(2) إنشاء مقالات نصية-صورية عالية الجودة. تم تقييم IXC-2.5 على 28 معياراً، وتفوّق على النماذج المفتوحة المصدر الرائدة في 16 معياراً. كما تفوق على GPT-4V وGemini Pro أو توازَن معهما في 16 مهمة رئيسية. يُمكن الوصول إلى InternLM-XComposer-2.5 مفتوحًا للعامة من خلال الرابط: https://github.com/InternLM/InternLM-XComposer.

ملف PDF المصدر عرض الكود

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Command Palette

InternLM-XComposer-2.5: نموذج لغوي بصري كبير متعدد الاستخدامات يدعم الإدخال والإخراج الطويلان.

Pan Zhang Xiaoyi Dong Yuhang Zang Yuhang Cao Rui Qian Lin Chen Qipeng Guo Haodong Duan Bin Wang Linke Ouyang17 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

InternLM-XComposer-2.5: نموذج لغوي بصري كبير متعدد الاستخدامات يدعم الإدخال والإخراج الطويلان.

Pan Zhang Xiaoyi Dong Yuhang Zang Yuhang Cao Rui Qian Lin Chen Qipeng Guo Haodong Duan Bin Wang Linke Ouyang17 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

InternLM-XComposer-2.5: نموذج لغوي بصري كبير متعدد الاستخدامات يدعم الإدخال والإخراج الطويلان.

Pan Zhang Xiaoyi Dong Yuhang Zang Yuhang Cao Rui Qian Lin Chen Qipeng Guo Haodong Duan Bin Wang Linke Ouyang17 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Pan Zhang Xiaoyi Dong Yuhang Zang Yuhang Cao Rui Qian Lin Chen Qipeng Guo Haodong Duan Bin Wang Linke Ouyang

Pan Zhang Xiaoyi Dong Yuhang Zang Yuhang Cao Rui Qian Lin Chen Qipeng Guo Haodong Duan Bin Wang Linke Ouyang

Pan Zhang Xiaoyi Dong Yuhang Zang Yuhang Cao Rui Qian Lin Chen Qipeng Guo Haodong Duan Bin Wang Linke Ouyang