HyperAIHyperAI

Command Palette

Search for a command to run...

شبكات التجميع متعددة الأوضاع للتعلم ذاتيًا من الفيديوهات غير المصنفة

الملخص

التعلم الذاتي متعدد الوسائط يحظى باهتمام متزايد لأنه ليس فقط يسمح بتدريب شبكات كبيرة دون إشراف بشري، بل أيضًا بالبحث واسترجاع البيانات عبر وسائط مختلفة. في هذا السياق، تقدم هذه الورقة إطارًا للتدريب الذاتي يتعلم مساحة تمثيلية متعددة الوسائط مشتركة، والتي بالإضافة إلى مشاركة التمثيلات عبر وسائط مختلفة، تفرض تجميع الحالات المتشابهة معانيًا. لهذا الغرض، نوسع مفهوم التعلم التضادي على مستوى الحالة بمراحل تجميع متعددة الوسائط في خط أنابيب التدريب للكشف عن التشابهات الدلالية عبر الوسائط. تمكن المساحة المدمجة الناتجة من استرجاع العينات عبر جميع الوسائط، حتى من قواعد بيانات غير مرئية ومجالات مختلفة. لتقييم نهجنا، قمنا بتدريب نموذجنا على مجموعة بيانات HowTo100M وتقييم قدراته على الاسترجاع بدون تدريب مسبق (zero-shot) في مجالين صعبين، وهما استرجاع النص إلى الفيديو وتحديد الأفعال الزمنية، مما أظهر نتائج رائدة على أربع مجموعات بيانات مختلفة.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp