16일 전

약한 예측을 활용한 강화된 사운드 이벤트 탐지

Hyeonuk Nam, Byeong-Yun Ko, Gyeong-Tae Lee, Seong-Hu Kim, Won-Ho Jung, Sang-Min Choi, Yong-Hwa Park
약한 예측을 활용한 강화된 사운드 이벤트 탐지
초록

소음 이벤트 탐지(Sound Event Detection, SED) 시스템의 성능은 강한 레이블을 가진 대규모 데이터셋을 생성하는 데 어려움으로 인해 크게 제한된다. 본 연구에서는 강한 레이블 데이터의 부족을 극복하기 위해 두 가지 주요 접근법을 사용하였다. 첫째, 입력 특징에 대해 강력한 데이터 증강(data augmentation) 기법을 적용하였다. 이 과정에서 음성/오디오 분야에서 일반적으로 사용되는 기존의 데이터 증강 방법 외에도, 본 연구에서 제안한 새로운 방법인 FilterAugment를 도입하였다. 둘째, 약한 예측(weak predictions)을 활용하여 약한 감독 기반 SED 성능을 향상시키는 두 가지 방법을 제안하였다. 그 결과, DESED 실재 검증 데이터셋에서 최고의 PSDS1 점수 0.4336과 최고의 PSDS2 점수 0.8161을 달성하였다. 본 연구는 DCASE 2021 Task4에 제출되었으며, 최종 순위에서 3위를 기록하였다. 코드는 다음과 같이 공개되어 있다: https://github.com/frednam93/FilterAugSED.

약한 예측을 활용한 강화된 사운드 이벤트 탐지 | 최신 연구 논문 | HyperAI초신경