HyperAI

Streaming Target Sound Extraction

استخراج الصوت المستهدف في التدفق هو نوع من مهمة استخراج الصوت المستهدف، يركز على معالجة الصوت في الوقت الفعلي. تتطلب هذه المهمة من الخوارزمية معالجة مقاطع صوتية أقصر من 20 ميلي ثانية في كل خطوة زمنية، باستخدام البيانات السابقة فقط لضمان انخفاض التأخير والسببية. هدفها هو استخراج الصوت المستهدف بدقة في بيئة تدفق في الوقت الفعلي، مما له قيمة تطبيقية كبيرة، مثل تحسين الكلام في الوقت الفعلي، قمع الضوضاء، ورصد الصوت.