HyperAIHyperAI

Command Palette

Search for a command to run...

تعلم تمييز التمثيلات الصوتية العامة

Aaqib Saeed David Grangier Neil Zeghidour

الملخص

نقدم COLA، وهي طريقة تدريب ذاتي مسبقة لتعلم تمثيل عام للصوت. تعتمد منهجيتنا على التعلم المقارن: فهي تتعلم تمثيلاً يُعيِّن درجة تشابه عالية للمقاطع الصوتية المستخرجة من نفس التسجيل بينما يُعيِّن درجة تشابه أقل للمقاطع المستخرجة من تسجيلات مختلفة. نبني على الإنجازات الحديثة في التعلم المقارن لرؤية الحاسوب والتعلم التعزيزي لتصميم نموذج ذاتي مراقب خفيف الوزن وسهل التنفيذ للصوت. نقوم بتدريب المتجهات المضمنة على قاعدة بيانات Audioset الضخمة ونقل هذه التمثيلات إلى 9 مهام تصنيف متنوعة، بما في ذلك الكلام، الموسيقى، أصوات الحيوانات، والمشهد الصوتي (acoustic scenes). نوضح أن طرقتنا، رغم بساطتها، تتفوق بشكل كبير على الأنظمة الذاتية المراقبة السابقة. كما نجري دراسات تقليصية (ablation studies) لتحديد الخيارات التصميمية الرئيسية ونشر مكتبة لتدريب وتuning نماذج COLA.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp