الانفصال غير المراقب للمصادر من خلال الاستدلال بايزي في المجال المخفي

تُعتمد النماذج الحديثة لفصل المصادر الصوتية على مناهج مدعومة بالبيانات، والتي يمكن أن تكون مكلفة من حيث موارد التصنيف. من ناحية أخرى، غالبًا ما تكون الطرق المُستخدمة لتدريب هذه النماذج دون أي توجيه مباشر مكلفة من حيث متطلبات الذاكرة والوقت، وتظل غير عملية للاستخدام أثناء الاستدلال (inference). نهدف إلى التغلب على هذه القيود من خلال اقتراح خوارزمية بسيطة ولكن فعالة لفصل غير مُراقبة، تعمل مباشرة على تمثيل خفي للإشارات الزمنية. تعتمد خوارزميتنا على افتراضات بايزية عميقة على شكل شبكات تلقائية (autoregressive) مُدرَّبة مسبقًا لتمثيل توزيعات الاحتمال لكل مصدر. ونستفيد من عدد منخفض نسبيًا من القيم الممكنة (low cardinality) في الفضاء الخفي المنفصل، والذي تم تدريبه باستخدام مصطلح خسارة جديد يفرض بنية حسابية دقيقة عليه، لإجراء استدلال بازى دقيق دون الاعتماد على استراتيجيات تقريبية. وقد قمنا بتوثيق نهجنا على مجموعة بيانات Slakh arXiv:1909.08494، حيث أظهرت النتائج تقاربًا مع أفضل النماذج المُدَرَّبة بمساعدة، مع استهلاك أقل للموارد مقارنةً بطرق غير مُراقبة أخرى.