Command Palette
Search for a command to run...
تحسين دقة الصوت باستخدام الشبكات العصبية
تحسين دقة الصوت باستخدام الشبكات العصبية
Kuleshov Volodymyr Enam S. Zayd Ermon Stefano
الملخص
نقدّم تقنية جديدة لمعالجة الصوت تُحسّن معدل أخذ العينات للإشارات مثل الكلام أو الموسيقى باستخدام الشبكات العصبية التلافيفية العميقة. يتم تدريب نموذجنا على أزواج من أمثلة الصوت ذات الجودة المنخفضة والجودة العالية؛ وفي مرحلة الاختبار، يقوم النموذج بتوقع القيم المفقودة ضمن إشارة منخفضة الدقة من خلال عملية تداخل تشبه تقنية تحسين الدقة في الصور. تمتاز هذه الطريقة ببساطتها ولا تتطلب استخدام تقنيات متخصصة لمعالجة الصوت؛ وقد أظهرت تجاربنا تفوقها على النماذج الأساسية في معايير قياس الكلام والموسيقى القياسية عند نسب تكبير تبلغ 2x و4x و6x. ولها تطبيقات عملية في مجالات الاتصالات الهاتفية، والضغط، وإنشاء الكلام من النص؛ كما تُظهر فعالية الهياكل التلافيفية المُعطّلة (feed-forward convolutional architectures) في مهام توليد الصوت.