HyperAIHyperAI

Command Palette

Search for a command to run...

تمييز النماذج السمعية والبصرية مع الاتفاق بين الأوضاع المختلفة

Pedro Morgado Nuno Vasconcelos Ishan Misra

الملخص

نقدم نهجًا ذاتي الإشراف لتعلم التمثيلات السمعية البصرية من الفيديو والصوت. يستخدم أسلوبنا التعلم المقارن للتمييز العابر للأنماط بين الفيديو والصوت وبالعكس. نوضح أن تحسين التمييز العابر للأنماط، بدلاً من التمييز داخل الأنماط، هو أمر مهم لتعلم تمثيلات جيدة من الفيديو والصوت. بفضل هذا الرؤية البسيطة ولكن القوية، يحقق أسلوبنا أداءً تنافسيًا عاليًا عند تعديله على مهام التعرف على الأفعال. بالإضافة إلى ذلك، بينما تعرّف الأعمال الحديثة في مجال التعلم المقارن العينات الإيجابية والسالبة كحالات فردية، فإننا نعمم هذه التعريف من خلال استكشاف الاتفاق العابر للأنماط. نقوم بتجميع حالات متعددة معًا كإيجابيات عن طريق قياس تشابهها في كل من فضاءات الخصائص البصرية والسمعية. يخلق الاتفاق العابر للأنماط مجموعات إيجابية وسالبة أفضل، مما يسمح لنا بضبط الشبهات البصرية من خلال البحث عن التمييز داخل الأنماط بين الحالات الإيجابية، وتحقيق مكاسب كبيرة في المهام اللاحقة (downstream tasks).


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp