HyperAI

Streaming Target Sound Extraction

L'extraction de son cible en flux continu est une variante de la tâche d'extraction de son cible, axée sur le traitement audio en temps réel. Cette tâche nécessite que l'algorithme traite des segments audio de moins de 20 millisecondes à chaque étape temporelle, en utilisant uniquement les données passées pour garantir une faible latence et la causalité. Son objectif est d'extraire précisément le son cible dans un environnement de diffusion en continu en temps réel, ce qui présente une valeur d'application significative, notamment pour l'amélioration vocale en temps réel, la suppression de bruit et la surveillance audio.