2달 전

WildDESED: 야생 환경 소리 이벤트 감지 시스템을 위한 LLM 기반 데이터셋

Xiao, Yang ; Das, Rohan Kumar
WildDESED: 야생 환경 소리 이벤트 감지 시스템을 위한 LLM 기반 데이터셋
초록

이 연구는 사운드 이벤트 검출(Sound Event Detection, SED) 분야를 발전시키기 위해 새로운 대형 언어 모델(Large Language Model, LLM) 기반 데이터셋인 와일드 도메스틱 환경 사운드 이벤트 검출(Wild Domestic Environment Sound Event Detection, WildDESED)을 제시합니다. 이 데이터셋은 원래 DESED 데이터셋의 확장판으로, 가정 환경에서의 다양한 음향 변동성과 복잡한 노이즈를 반영하기 위해 설계되었습니다. 우리는 DESED 데이터셋의 목표 사운드 카테고리를 기반으로 LLM을 활용하여 8가지 다른 가정 시나리오를 생성했습니다. 그 다음에 AudioSet에서 선택된 노이즈의 세심하게 조정된 혼합을 사용하여 시나리오를 풍부하게 만들었으며, 목표 사운드와 중복되지 않도록 하였습니다. 우리는 널리 알려진 컨벌루션 신경 순환망(Convolutional Neural Recurrent Network)을 이용하여 WildDESED 데이터셋을 연구하였으며, 이 데이터셋의 어려움을 잘 보여주었습니다. 그런 다음 점진적으로 노이즈 복잡성을 증가시키는 교육 과정 학습(Curriculum Learning) 방법을 적용하여 모델의 다양한 노이즈 수준에서 일반화 능력을 향상시켰습니다. 이러한 접근법으로 얻은 결과는 소음 환경 내에서 개선되었음을 보여주며, WildDESED 데이터셋의 효과성을 입증하고 소음에 강한 SED 발전을 촉진하는 데 기여하였습니다.

WildDESED: 야생 환경 소리 이벤트 감지 시스템을 위한 LLM 기반 데이터셋 | 최신 연구 논문 | HyperAI초신경