HyperAIHyperAI

Command Palette

Search for a command to run...

الانحراف المتبادل للمعلومات: مقياس موحد للنماذج التوليدية متعددة الأوضاع

Jin-Hwa Kim* Yunji Kim Jiyoung Lee Kang Min Yoo Sang-Woo Lee

الملخص

توليد الصور من النص ووصف الصور قد ظهر مؤخرًا كنموذج تجريبي جديد لتقييم الذكاء الآلي. يتوقع هذا النموذج كميات مستمرة مصحوبة بتقنيات العينة المستخدمة في التوليد، مما يجعل التقييم معقدًا وغير قابل للحل للحصول على التوزيعات الحاشية. استنادًا إلى الاتجاه الحديث الذي يستغل فيه تقييمات المولدات متعددة الوسائط نموذجًا مسبق التدريب على الرؤية واللغة، نقترح استخدام المعلومات المتبادلة الجاوسية السالبة باستخدام خصائص CLIP كمعيار موحد، والذي أطلقنا عليه اسم اختلاف المعلومات المتبادلة (MID). للاختبار، قمنا بمقارنة شاملة لهذا المعيار مع المقاييس المنافسة باستخدام أحكام تم إنشاؤها بعناية أو تم توثيقها من قبل البشر في مهام توليد الصور من النص ووصف الصور. أظهر MID المقترح تفوقًا كبيرًا على الأساليب التنافسية من خلال تحقيق الاتساق عبر مقاييس الأداء، وكفاءة العينات، والمتانة تجاه النموذج CLIP المستغل. نتطلع إلى رؤية الدلالات غير المعروفة جيدًا للمعلومات المتبادلة الجاوسية السالبة في تعلم التمثيل متعدد الوسائط والأعمال المستقبلية التي تستند إلى هذه المقترحة الجديدة.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp