HyperAIHyperAI

Command Palette

Search for a command to run...

المنطق الذاتي النقدي لتحسين الإجابة على الأسئلة البصرية بشكل متين

Jialin Wu; Raymond J. Mooney

الملخص

أنظمة التعلم العميق للإجابة على الأسئلة البصرية (VQA) تميل إلى التقاط الارتباطات الإحصائية السطحية في بيانات التدريب بسبب الأولويات اللغوية القوية، مما يؤدي إلى فشلها في التعميم على بيانات الاختبار ذات التوزيع السؤال-الإجابة (QA) المختلف بشكل كبير. لمعالجة هذه المشكلة، نقدم هدف تدريب ذاتي ناقد يضمن أن شروحات الإجابات الصحيحة بصرياً تتطابق مع المناطق البصرية الأكثر تأثيراً أكثر من المرشحين الآخرين للإجابة. يمكن تحديد المناطق المؤثرة إما من خلال شروحات بصرية/نصية قدمها البشر أو تلقائياً من الكلمات المهمة فقط في السؤال والإجابة. نقيم نهجنا في مهمة التعميم VQA باستخدام مجموعة بيانات VQA-CP، ونحقق أحدث مستوى عالمي، أي 49.5٪ باستخدام الشروحات النصية و48.5٪ باستخدام المناطق المُشَرَّحَة تلقائياً (automatically annotated regions).


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
المنطق الذاتي النقدي لتحسين الإجابة على الأسئلة البصرية بشكل متين | مستندات | HyperAI