HyperAIHyperAI
منذ 2 أشهر

تعلم تمثيلات الكلام المستقلة عن المشكلة من مهام ذاتية متعددة

Santiago Pascual; Mirco Ravanelli; Joan Serrà; Antonio Bonafonte; Yoshua Bengio
تعلم تمثيلات الكلام المستقلة عن المشكلة من مهام ذاتية متعددة
الملخص

تعلم تمثيلات جيدة دون إشراف لا يزال مشكلة مفتوحة في مجال التعلم الآلي، وهو أمر يمثل تحديًا خاصًا للإشارات الصوتية، التي غالبًا ما يتميز بها السلاسل الطويلة ذات البنية الهرمية المعقدة. ومع ذلك، أظهرت بعض الأعمال الحديثة أنه من الممكن استخراج تمثيلات صوتية مفيدة باستخدام نهج مرممِّم-محودِّد ذاتي الإشراف (encoder-discriminator). تقدم هذه الورقة طريقة ذاتية الإشراف محسنة، حيث يتبع مرممِّم عصبي واحد عدة عمال يعملون معًا لحل مهام ذاتية الإشراف مختلفة. توافق المطلوب عبر المهام المختلفة يفرض قيودًا ذات معنى على المرممِّم، مما يساهم في اكتشاف تمثيلات عامة وخفض خطر تعلم الخصائص السطحية. تظهر التجارب أن النهج المقترح يمكنه تعلم خصائص قابلة للنقل، متينة، وغير مرتبطة بالمشكلة تحمل المعلومات ذات الصلة من الإشارة الصوتية، مثل هوية المتحدث، الفونمات وحتى الخصائص الأعلى مستوى مثل مؤشرات العواطف. بالإضافة إلى ذلك، فإن العديد من الخيارات التصميمية تجعل المرممِّم قابلاً للتصدير بسهولة، مما يسهل استخدامه المباشر أو تعديله لمشاكل مختلفة.

تعلم تمثيلات الكلام المستقلة عن المشكلة من مهام ذاتية متعددة | أحدث الأوراق البحثية | HyperAI