الملخص

تُعدّ الطرق الكبيرة الحجم للتدريب المسبق التي تتعلم التمثيلات عبر الوسائط على أزواج الصور والنصوص شائعةً في المهام البصرية-اللغوية. في حين أن الطرق الحالية تُجمّع ببساطة ميزات مناطق الصورة وميزات النص كمدخلات للنموذج المُدرّب مسبقًا، وتستخدم الانتباه الذاتي لتعلم التوافيق المعنى بين الصور والنصوص بطريقة قصوى، نقترح في هذا البحث طريقة تعلم جديدة تُسمّى "أوسكار" (Oscar: Object-Semantics Aligned Pre-training)، والتي تستخدم العلامات الكائنية المُكتشفة في الصور كنقاط مرجعية لتقليل الصعوبة بشكل كبير في تعلم هذه التوافيق. تُحفّز هذه الطريقة على ملاحظة أن الكائنات البارزة في الصورة يمكن اكتشافها بدقة، وغالبًا ما تُذكر في النص المرتبط بها. قمنا بتدريب نموذج أوسكار مسبقًا على مجموعة بيانات عامة تتضمن 6.5 مليون زوج من النصوص والصور، ثم قمنا بتعديله الدقيق (fine-tuning) على المهام اللاحقة، مما أدى إلى تحقيق أداءً جديدًا قياسيًا على ستة مهام مُتّقدمة معروفة في فهم وتكوين الرؤية واللغة.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Command Palette

أوسكار: التدريب المسبق المتماشي مع الدلالة الكائنية للمهام البصرية-اللغوية

Xiujun Li Xi Yin Chunyuan Li Pengchuan Zhang Xiaowei Hu Lei Zhang Lijuan Wang Houdong Hu Li Dong Furu Wei2 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

أوسكار: التدريب المسبق المتماشي مع الدلالة الكائنية للمهام البصرية-اللغوية

Xiujun Li Xi Yin Chunyuan Li Pengchuan Zhang Xiaowei Hu Lei Zhang Lijuan Wang Houdong Hu Li Dong Furu Wei2 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

أوسكار: التدريب المسبق المتماشي مع الدلالة الكائنية للمهام البصرية-اللغوية

Xiujun Li Xi Yin Chunyuan Li Pengchuan Zhang Xiaowei Hu Lei Zhang Lijuan Wang Houdong Hu Li Dong Furu Wei2 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Xiujun Li Xi Yin Chunyuan Li Pengchuan Zhang Xiaowei Hu Lei Zhang Lijuan Wang Houdong Hu Li Dong Furu Wei

Xiujun Li Xi Yin Chunyuan Li Pengchuan Zhang Xiaowei Hu Lei Zhang Lijuan Wang Houdong Hu Li Dong Furu Wei

Xiujun Li Xi Yin Chunyuan Li Pengchuan Zhang Xiaowei Hu Lei Zhang Lijuan Wang Houdong Hu Li Dong Furu Wei