15日前

弱教師付き予測を活用した強化された音響イベント検出

Hyeonuk Nam, Byeong-Yun Ko, Gyeong-Tae Lee, Seong-Hu Kim, Won-Ho Jung, Sang-Min Choi, Yong-Hwa Park
弱教師付き予測を活用した強化された音響イベント検出
要約

音声イベント検出(Sound Event Detection, SED)システムの性能は、大規模な強ラベル付きデータセットを生成する困難さによって大きく制限されている。本研究では、強ラベル付きデータの不足を克服するため、2つの主要なアプローチを採用した。第一に、入力特徴量に対して強力なデータ拡張を適用した。使用したデータ拡張手法は、音声・音響分野で従来用いられてきた手法に加え、本研究で提案する新しい手法「FilterAugment」を含む。第二に、弱ラベル予測を活用して弱教師付きSEDの性能を向上させる2つの手法を提案した。その結果、DESEDの実データ検証セットにおいて、PSDS1が0.4336、PSDS2が0.8161という最高スコアを達成した。本研究はDCASE 2021 Task4に提出され、3位の順位を獲得した。コードは公開されており、以下から入手可能:https://github.com/frednam93/FilterAugSED。

弱教師付き予測を活用した強化された音響イベント検出 | 最新論文 | HyperAI超神経