Command Palette
Search for a command to run...
弱教師付き予測を活用した強化された音響イベント検出
弱教師付き予測を活用した強化された音響イベント検出
Hyeonuk Nam Byeong-Yun Ko Gyeong-Tae Lee Seong-Hu Kim Won-Ho Jung Sang-Min Choi Yong-Hwa Park
概要
音声イベント検出(Sound Event Detection, SED)システムの性能は、大規模な強ラベル付きデータセットを生成する困難さによって大きく制限されている。本研究では、強ラベル付きデータの不足を克服するため、2つの主要なアプローチを採用した。第一に、入力特徴量に対して強力なデータ拡張を適用した。使用したデータ拡張手法は、音声・音響分野で従来用いられてきた手法に加え、本研究で提案する新しい手法「FilterAugment」を含む。第二に、弱ラベル予測を活用して弱教師付きSEDの性能を向上させる2つの手法を提案した。その結果、DESEDの実データ検証セットにおいて、PSDS1が0.4336、PSDS2が0.8161という最高スコアを達成した。本研究はDCASE 2021 Task4に提出され、3位の順位を獲得した。コードは公開されており、以下から入手可能:https://github.com/frednam93/FilterAugSED。