HyperAI
منذ 18 أيام

GenRecal: التوليد بعد إعادة الت headlcalibration من النماذج الكبيرة إلى الصغيرة للرؤية واللغة

Byung-Kwan Lee, Ryo Hachiuma, Yong Man Ro, Yu-Chiang Frank Wang, Yueh-Hua Wu
GenRecal: التوليد بعد إعادة الت headlcalibration من النماذج الكبيرة إلى الصغيرة للرؤية واللغة
الملخص

التطورات الحديثة في نماذج الرؤية واللغة (VLMs) استفادت من النماذج اللغوية الكبيرة (LLMs) لتحقيق أداء مماثل لأنظمة المصادر المغلقة مثل GPT-4V. ومع ذلك، فإن نشر هذه النماذج في السيناريوهات الحقيقية، خاصة على الأجهزة ذات الموارد المحدودة، لا يزال تحديًا بسبب متطلباتها الحسابية الكبيرة. هذا الأمر أثار اهتمامًا بتنقية المعرفة من النماذج VLM الكبيرة إلى نماذج أصغر وأكثر كفاءة. تنشأ تحدي رئيسي هنا من تنوع هياكل النماذج VLM، والتي تُبنى على نماذج LLM مختلفة وتستخدم أنواعًا متنوعة من الرموز-المختلفة في حجم المفردات، تقسيمات الرموز وترتيب مؤشرات الرموز. لحل هذا التحدي المرتبط بنوع معين من النماذج VLM، نقدم "الإنشاء بعد إعادة الت head="calibration" (GenRecal)"، وهو إطار عام جديد للتنقية يناسب النماذج VLM. يضم GenRecal جهاز إعادة ت head="calibration" يقوم بمواءمة وتكييف تمثيلات الخصائص بين النماذج VLM غير المتجانسة، مما يمكن من نقل فعال للمعرفة عبر أنواع مختلفة من النماذج VLM. من خلال التجارب الواسعة على عدة مقاييس صعبة، نثبت أن GenRecal يحسن بشكل كبير الأداء الأساسي ويتفوق في نهاية المطاف على النماذج VLM المصادر المفتوحة والمغلقة ذات الحجم الكبير.请注意,我已将“re head=”calibration””中的“head=””去掉,以确保翻译的准确性。正确的翻译应该是:... نقدم "الإنشاء بعد إعادة التحليلا (GenRecal)"، وهو إطار عام جديد للتنقية يناسب النماذج VLM. يضم GenRecal جهاز إعادة التحليلا يقوم بمواءمة وتكييف تمثيلات الخصائص بين النماذج VLM غير المتجانسة...但是为了更好地符合阿拉伯语的表达习惯,建议将其简化为:... نقدم "الإنشاء بعد إعادة التحليلا (GenRecal)"، وهو إطار عام جديد للتنقية لنماذج الرؤية واللغة. يستخدم GenRecal جهاز إعادة التحليلا لمواءمة وتكييف تمثيلات الخصائص بين النماذج VLM غير المتجانسة...最终版本如下:التطورات الحديثة في نماذج الرؤية واللغة (VLMs) استفادت من النماذج اللغوية الكبيرة (LLMs) لتحقيق أداء مماثل لأنظمة المصادر المغلقة مثل GPT-4V. ومع ذلك، فإن نشر هذه النماذج في السيناريوهات الحقيقية، خاصة على الأجهزة ذات الموارد المحدودة، لا يزال تحديًا بسبب متطلباتها الحسابية الكبيرة. هذا الأمر أثار اهتمامًا بتنقية المعرفة من النمازل VLM الكبيرة إلى نمازل أصغر وأكثر كفاءة. تنشأ تحدي رئيسي هنا من تنوع هياكل النمواذج VLM، والتي تُبنى على نمواذج LLM مختلفة وتستخدم أنواعًا متنوعة من الرموز-المختلفة في حجم المفردات، تقسيمات الرموز وترتيب مؤشرات الرموز. لحل هذا التحدي المرتبط بنوع معين من النمواذج VLM، نقدم "الإنشاء بعد إعادة التحليلا (GenRecal)"، وهو إطار عام جديد للتنقية لنمواذج الرؤية واللغة. يستخدم GenRecal جهاز إعادة التحليلا لمواءمة وتكييف تمثيلات الخصائص بين النمواذج VLM غير المتجانسة، مما يمكن من نقل فعال للمعرفة عبر أنواع مختلفة من النمواذج VLM. من خلال التجارب الواسعة على عدة مقاييس صعبة، نثبت أن GenRecal يحسن بشكل كبير الأداء الأساسي ويتفوق في نهاية المطاف على النمواذج VLM المصادر المفتوحة والمغلقة ذات الحجم الكبير.