الملخص

التعلم الذاتي متعدد الوسائط يحظى باهتمام متزايد لأنه ليس فقط يسمح بتدريب شبكات كبيرة دون إشراف بشري، بل أيضًا بالبحث واسترجاع البيانات عبر وسائط مختلفة. في هذا السياق، تقدم هذه الورقة إطارًا للتدريب الذاتي يتعلم مساحة تمثيلية متعددة الوسائط مشتركة، والتي بالإضافة إلى مشاركة التمثيلات عبر وسائط مختلفة، تفرض تجميع الحالات المتشابهة معانيًا. لهذا الغرض، نوسع مفهوم التعلم التضادي على مستوى الحالة بمراحل تجميع متعددة الوسائط في خط أنابيب التدريب للكشف عن التشابهات الدلالية عبر الوسائط. تمكن المساحة المدمجة الناتجة من استرجاع العينات عبر جميع الوسائط، حتى من قواعد بيانات غير مرئية ومجالات مختلفة. لتقييم نهجنا، قمنا بتدريب نموذجنا على مجموعة بيانات HowTo100M وتقييم قدراته على الاسترجاع بدون تدريب مسبق (zero-shot) في مجالين صعبين، وهما استرجاع النص إلى الفيديو وتحديد الأفعال الزمنية، مما أظهر نتائج رائدة على أربع مجموعات بيانات مختلفة.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Command Palette

شبكات التجميع متعددة الأوضاع للتعلم ذاتيًا من الفيديوهات غير المصنفة

Brian Chen Andrew Rouditchenko Kevin Duarte Hilde Kuehne Samuel Thomas Angie Boggust Rameswar Panda Brian Kingsbury Rogerio Feris David Harwath3 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

شبكات التجميع متعددة الأوضاع للتعلم ذاتيًا من الفيديوهات غير المصنفة

Brian Chen Andrew Rouditchenko Kevin Duarte Hilde Kuehne Samuel Thomas Angie Boggust Rameswar Panda Brian Kingsbury Rogerio Feris David Harwath3 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

شبكات التجميع متعددة الأوضاع للتعلم ذاتيًا من الفيديوهات غير المصنفة

Brian Chen Andrew Rouditchenko Kevin Duarte Hilde Kuehne Samuel Thomas Angie Boggust Rameswar Panda Brian Kingsbury Rogerio Feris David Harwath3 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Brian Chen Andrew Rouditchenko Kevin Duarte Hilde Kuehne Samuel Thomas Angie Boggust Rameswar Panda Brian Kingsbury Rogerio Feris David Harwath

Brian Chen Andrew Rouditchenko Kevin Duarte Hilde Kuehne Samuel Thomas Angie Boggust Rameswar Panda Brian Kingsbury Rogerio Feris David Harwath

Brian Chen Andrew Rouditchenko Kevin Duarte Hilde Kuehne Samuel Thomas Angie Boggust Rameswar Panda Brian Kingsbury Rogerio Feris David Harwath