2달 전

MetaAudio: 소수 샷 오디오 분류 벤치마크

Heggan, Calum ; Budgett, Sam ; Hospedales, Timothy ; Yaghoobi, Mehrdad
MetaAudio: 소수 샷 오디오 분류 벤치마크
초록

현재 사용 가능한 소량 샘플 학습(few-shot learning, 훈련 예제가 적은 기계 학습) 벤치마크는 주로 이미지 분류에 초점을 맞추고 있어 다루는 영역이 제한적입니다. 본 연구의 목적은 이미지 기반 벤치마크에 대한 의존성을 완화하고, 다양한 사운드 영역과 실험 설정을 포함하는 첫 번째 포괄적이고 공개적이며 완전히 재현 가능한 오디오 기반 대안을 제공하는 것입니다. 우리는 환경 소음부터 인간의 말소리까지 다섯 가지 오디오 데이터셋에서 다양한 기술의 소량 샘플 분류 성능을 비교합니다. 이를 확장하여, 모든 데이터셋을 훈련 과정에서 사용하는 공동 훈련(joint training) 및 크로스-데이터셋 적응(cross-dataset adaptation) 프로토콜에 대해 심층 분석을 수행하여 일반적인 오디오 소량 샘플 분류 알고리즘의 가능성을 확인하였습니다. 실험 결과, MAML(Meta-Learning Algorithm with Model-Agnostic Meta-Learning) 및 Meta-Curvature와 같은 그래디언트 기반 메타 학습 방법이 지표(metric) 및 베이스라인(baseline) 방법보다 일관되게 우수한 성능을 보임을 확인하였습니다. 또한 공동 훈련 루틴이 환경 소음 데이터베이스의 전반적인 일반화를 도움으로써, 크로스-데이터셋/영역 설정에서도 어느 정도 효과적인 방법임을 입증하였습니다.

MetaAudio: 소수 샷 오디오 분류 벤치마크 | 최신 연구 논문 | HyperAI초신경