HyperAIHyperAI

Command Palette

Search for a command to run...

تدريب على التنوّع في وصف الصور بالفقرات

George Han er Luke Melas-Kyriazi Alex Rush

الملخص

تهدف نماذج وصف الفقرات الصورية إلى إنتاج وصف تفصيلي للصورة المصدرية. وتستخدم هذه النماذج تقنيات مشابهة لتلك المستخدمة في نماذج وصف الصور القياسية، لكنها واجهت مشكلات في توليد النص، لا سيما نقص التنوّع بين الجمل، مما حدّ من فعاليتها. في هذا العمل، ننظر إلى تطبيق التدريب على مستوى التسلسل لهذه المهمة. ونجد أن التدريب الذاتي القياسي يُنتج نتائج ضعيفة، لكن عند دمجه مع عقوبة متكاملة على تكرار الترايغرام (ثلاثية الكلمات)، يُنتج نتائج أكثر تنوّعًا في الفقرات. ويُحسّن هذا النهج البسيط من أفضل نتيجة مُحققة على مجموعة بيانات وصف الفقرات Visual Genome من 16.9 إلى 30.6 في مؤشر CIDEr، مع تحقيق مكاسب أيضًا في مؤشري METEOR وBLEU، دون الحاجة إلى أي تغييرات معمارية.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
تدريب على التنوّع في وصف الصور بالفقرات | مستندات | HyperAI