الملخص

في هذا البحث، نقترح نموذجًا جديدًا لتوليد الصوت دون شروط يعتمد على إنتاج عينة صوتية واحدة تلو الأخرى. نوضح أن نموذجنا، الذي يستفيد من دمج وحدات بلا ذاكرة، وهي الشبكات العصبية المتعددة الطبقات التلقائية (autoregressive multilayer perceptrons)، والشبكات العصبية المتكررة ذات الحالة (stateful recurrent neural networks) في بنية هرمية، قادر على التقاط مصادر التباين الأساسية في السلاسل الزمنية على فترات زمنية طويلة جدًا، وذلك على ثلاثة مجموعات بيانات مختلفة الطبيعة. تقييم البشر للعينات المُنتجة يشير إلى أن نموذجنا يُفضل على النماذج المنافسة. كما نوضح كيف يساهم كل مكون من مكونات النموذج في الأداء المعروض.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار