HyperAIHyperAI

Command Palette

Search for a command to run...

WaveGlow: شبكة توليدية قائمة على التدفق لتركيب الكلام

A. van den Oord S. Dieleman H. Zen K. Simonyan O. Vinyals A. Graves N. Kalchbrenner

الملخص

في هذا البحث، نقترح WaveGlow: شبكة مستندة إلى التدفق قادرة على توليد كلام عالي الجودة من مخططات الميل الطيفية (mel-spectrograms). يجمع WaveGlow بين الأفكار المستوحاة من Glow وWaveNet لتقديم تركيب صوتي سريع وكفء وعالي الجودة، دون الحاجة إلى الانحدار الذاتي (auto-regression). يتم تنفيذ WaveGlow باستخدام شبكة واحدة فقط، ويتم تدريبها باستخدام دالة تكلفة واحدة فقط: تعظيم احتمالية البيانات التدريبية، مما يجعل إجراءات التدريب بسيطة ومستقرة. تنتج تنفيذنا باستخدام PyTorch عينات صوتية بمعدل يزيد عن 500 كيلوهرتز على معالج الرسومات NVIDIA V100. تظهر درجات الرأي المتوسطة أن جودة الصوت التي توفرها مماثلة لأفضل تنفيذ عام لـ WaveNet متاح للجمهور. سيتم توفير جميع الكود بشكل عام عبر الإنترنت.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp