HyperAIHyperAI

Command Palette

Search for a command to run...

التعلم المقابل متعدد التنسيقات للتمثيلات الصوتية

Luyu Wang Aaron van den Oord

الملخص

تشير التطورات الحديثة إلى ميزة التدريب متعدد الوسائط مقارنةً بالأساليب الأحادية الوسائط. وخلافًا لهذه الرؤية، نجد في عملنا أن نفس المكاسب يمكن تحقيقها من خلال التدريب باستخدام صيغ مختلفة لنوع وسائط واحد. وبشكل خاص، نستكشف استخدام إطار التعلم التبايني (contrastive learning) لتعلم تمثيلات صوتية من خلال تعظيم التوافق بين الصوت الخام وتمثيله الطيفي. ونلاحظ تحسنًا ملحوظًا باستخدام هذه الاستراتيجية متعددة الصيغ مقارنةً بالبدائل الأحادية الصيغة. علاوةً على ذلك، حققت طريقة الصوت فقط لدينا نتائج جديدة قياسية على مهام التصنيف اللاحقة مثل AudioSet وESC-50، حيث بلغ متوسط الدقة المتوسطة (mean average precision) 0.376 والدقة 90.5% على التوالي.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp