ターゲット音抽出 | SOTA | HyperAI超神経

ターゲットサウンド抽出は、音の特定のカテゴリーをオーディオ混合信号から抽出するタスクです。このタスクでは、複雑な音環境（背景ノイズを含む）から指定された前景の音成分を分離することを目指します。モデルへの入力形式は、文字列、整数、またはサウンドカテゴリーの一時エンコーディングのいずれかです。この技術は、音声認識、音楽処理、環境音響監視などの分野で重要な応用価値を持っています。