18일 전

ODAQ: 오디오 품질의 오픈 데이터셋 - GitHub에서의 벤치마크

{E. A. P. Habets, Wolcott, W., M. M. Halimeh, P. A. Williams, S. Dick, C.-W. Wu, M. Torcoli}
초록

ODAQ는 주관적 음질 평가 점수가 동반된 오디오 신호 데이터셋이 부족한 문제를 해결하기 위해 제안된 데이터셋이다.ODAQ는 MUSHRA 청취 실험을 통해 확보한 240개의 오디오 샘플과 해당하는 음질 점수를 포함하고 있다.음질 평가가 이루어진 오디오 샘플들은 원본 오디오 자료를 처리한 버전이며, 원본 오디오 자료는 다음과 같은 구성으로 제공된다: 스테레오 오디오(샘플링 주파수 44.1kHz 또는 48kHz), 음악 샘플 14개(이 중 8개는 솔로 녹음), 영화와 유사한 사운드트랙 11개(대사와 음악, 효과음이 혼합된 콘텐츠), 별도의 스템(Stem) 및 대사 텍스트도 함께 제공된다.본 데이터셋은 오디오 음질에 대한 객관적 측정 방법의 성능을 평가하기 위한 벤치마킹 목적에 사용된다.