الملخص

تستهلك الرموز البصرية موارد حسابية كبيرة في النماذج الكبيرة متعددة الوسائط (MLLMs)، مما يؤثر بشكل كبير على كفاءتها. حاولت الدراسات الحديثة تحسين الكفاءة من خلال ضغط الرموز البصرية أثناء التدريب، إما من خلال تعديل مكونات النموذج أو عن طريق إدخال معلمات إضافية. ومع ذلك، غالبًا ما تتجاهل هذه الدراسات الصعوبة التعليمية المتزايدة الناتجة عن هذا الضغط، إذ يجد فضاء المعاملات في النموذج صعوبة في التكيف السريع مع الاضطرابات الكبيرة التي تحدث في فضاء الميزات نتيجة لضغط الرموز. في هذا العمل، نقترح تطوير نماذج MLLMs الفعالة من خلال إطار عمل تعلُّم تدريجي يُسمى "الاستخلاص التكاملي التدريجي" (EPIC). وبشكل خاص، وباستخدام تحليل الاضطرابات في فضاء الميزات الناتجة عن ضغط الرموز على مستويي الرمز (token-wise) والطبقة (layer-wise)، نقدّم على التوالي استخلاص التكامل الرمزي (token consistency distillation) واستخلاص التكامل الطبقي (layer consistency distillation)، بهدف تقليل صعوبة التدريب من خلال الاستفادة من التوجيه المقدم من نموذج معلم (teacher model) والالتزام بمسار تعلُّم تدريجي. تُظهر التجارب الواسعة الفعالية الفائقة، والمتانة، والقدرات التعميمية العالية لإطارنا المُقترح.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Command Palette

نماذج اللغة الكبيرة متعددة الوسائط الفعّالة من خلال التقطيع المتسق التدريجي

Zichen Wen Shaobo Wang Yufa Zhou Junyuan Zhang Qintong Zhang Yifeng Gao Zhaorun Chen Bin Wang Weijia Li Conghui He1 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

نماذج اللغة الكبيرة متعددة الوسائط الفعّالة من خلال التقطيع المتسق التدريجي

Zichen Wen Shaobo Wang Yufa Zhou Junyuan Zhang Qintong Zhang Yifeng Gao Zhaorun Chen Bin Wang Weijia Li Conghui He1 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

نماذج اللغة الكبيرة متعددة الوسائط الفعّالة من خلال التقطيع المتسق التدريجي

Zichen Wen Shaobo Wang Yufa Zhou Junyuan Zhang Qintong Zhang Yifeng Gao Zhaorun Chen Bin Wang Weijia Li Conghui He1 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Zichen Wen Shaobo Wang Yufa Zhou Junyuan Zhang Qintong Zhang Yifeng Gao Zhaorun Chen Bin Wang Weijia Li Conghui He

Zichen Wen Shaobo Wang Yufa Zhou Junyuan Zhang Qintong Zhang Yifeng Gao Zhaorun Chen Bin Wang Weijia Li Conghui He

Zichen Wen Shaobo Wang Yufa Zhou Junyuan Zhang Qintong Zhang Yifeng Gao Zhaorun Chen Bin Wang Weijia Li Conghui He