HyperAIHyperAI

Command Palette

Search for a command to run...

تعزيز قوة نماذج التفكير متعددة الوسائط الصغيرة لتطابق النماذج الأكبر من خلال التدريب الذاتي المتسق

Cheng Tan extsuperscript1,4,5 extsuperscript* Jingxuan Wei extsuperscript2,3 extsuperscript* extsuperscript** Zhangyang Gao extsuperscript1,4,5 extsuperscript* Linzhuang Sun extsuperscript2,3 Siyuan Li extsuperscript1,4,5 Ruifeng Guo extsuperscript2,3 Bihui Yu extsuperscript2,3 Stan Z. Li extsuperscript4 extsuperscript** extsuperscript@

الملخص

الاستدلال متعدد الوسائط هو مهمة صعبة تتطلب من النماذج الاستدلال عبر وسائط متعددة للإجابة على الأسئلة. قد أحرزت الأساليب الحالية تقدماً من خلال دمج الوسائط اللغوية والبصرية في إطار استدلال ذو مرحلتين، يفصل بين إنشاء العقلانية وإستنتاج الإجابة. ومع ذلك، غالباً ما تكون هذه الأساليب قاصرة بسبب جودة العقلانيات المولدة غير الكافية. في هذا البحث، نغوص في أهمية العقلانيات في استدلال النموذج. لقد لاحظنا أن عندما تكون العقلانيات دقيقة تماماً، تتحسن دقة النموذج بشكل كبير، مما يؤكد الحاجة إلى إنشاء عقلانيات عالية الجودة. مستوحى من هذا الأمر، نقترح MC-CoT، وهو استراتيجية تدريب ذاتية متسقة تولد العديد من العقلانيات والإجابات، ثم تقوم باختيار الأكثر دقة من خلال عملية التصويت. لا يقتصر هذا الأسلوب على تعزيز جودة العقلانيات المولدة فحسب، بل يؤدي أيضًا إلى إجابات أكثر دقة ومتانة. من خلال التجارب الشاملة، نثبت أن أسلوبنا يحسن بشكل كبير أداء النموذج عبر مختلف المقاييس القياسية. وبشكل ملحوظ، نظهر أنه حتى النماذج الأساسية الأصغر حجماً يمكنها تحقيق نتائج مماثلة لتلك التي حققها النماذج الأكبر عند تجهيزها بأسلوبنا المقترح، مما يوضح إمكانية أسلوبنا في الاستفادة من قوة العقلانيات لتحسين الاستدلال متعدد الوسائط. الرمز البرمجي متاح على https://github.com/chengtan9907/mc-cot.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp