التعلم من التسلسل إلى متعدد التسلسلات عبر التمثيل المتسلسل الشرطي للإشارات المختلطة

تم تأسيس نماذج التسلسل العصبي من النوع التسلسلي-النتيجة بشكل جيد في التطبيقات التي يمكن صياغتها على شكل تحويل تسلسل إدخال واحد إلى تسلسل نتيجة واحد. وفي هذه الدراسة، نركز على مشكلات التحويل التسلسلي من واحد إلى كثير، مثل استخلاص مصادر متعددة متسلسلة من تسلسل مختلط. ونُوَسِّع النموذج التسلسلي-النتيجة القياسي ليصبح نموذجًا متعدد التسلسلات الشرطي، والذي يُمثّل بشكل صريح العلاقة بين التسلسلات الناتجة المتعددة باستخدام قاعدة السلسلة الاحتمالية. وباستناد إلى هذا التوسّع، يمكن لنماذجنا استنتاج التسلسلات الناتجة بشكل شرطي، واحدة تلو الأخرى، باستخدام كل من التسلسل الإدخالي والسلسلة الناتجة السياقية المُقدَّرة سابقًا. كما يتميّز هذا النموذج بمعيار توقف بسيط وفعال لتحديد نهاية التحويل، مما يجعله قادرًا على استنتاج عدد متغير من التسلسلات الناتجة. ونختار بيانات الصوت كمجال اختبار رئيسي لتقييم طرقنا، نظرًا لأن بيانات الصوت المُلاحظة غالبًا ما تتكون من مصادر متعددة بسبب طبيعة مبدأ التراكب للموجات الصوتية. وتشير التجارب التي أُجريت على مهام مختلفة، بما في ذلك فصل الصوت والاعتراف بالصوت من أكثر من متحدث، إلى أن النماذج المتعددة التسلسلات الشرطية التي نقترحها تحقق تحسينات مستمرة مقارنة بالنماذج التقليدية غير الشرطية.