منذ 2 أشهر
SampleRNN: نموذج توليد صوتي عصبي غير مشروط من البداية إلى النهاية
Soroush Mehri; Kundan Kumar; Ishaan Gulrajani; Rithesh Kumar; Shubham Jain; Jose Sotelo; Aaron Courville; Yoshua Bengio

الملخص
في هذا البحث، نقترح نموذجًا جديدًا لتوليد الصوت دون شروط يعتمد على إنتاج عينة صوتية واحدة تلو الأخرى. نوضح أن نموذجنا، الذي يستفيد من دمج وحدات بلا ذاكرة، وهي الشبكات العصبية المتعددة الطبقات التلقائية (autoregressive multilayer perceptrons)، والشبكات العصبية المتكررة ذات الحالة (stateful recurrent neural networks) في بنية هرمية، قادر على التقاط مصادر التباين الأساسية في السلاسل الزمنية على فترات زمنية طويلة جدًا، وذلك على ثلاثة مجموعات بيانات مختلفة الطبيعة. تقييم البشر للعينات المُنتجة يشير إلى أن نموذجنا يُفضل على النماذج المنافسة. كما نوضح كيف يساهم كل مكون من مكونات النموذج في الأداء المعروض.