11일 전

Odyssey 2024 - 음성 감정 인식 챌린지: 데이터셋, 베이스라인 프레임워크 및 결과

{Carlos Busso, Berrak Sisman, Najim Dehak, Leibny Paola Garcia, Thomas Thebaud, Laureano Moro Velazquez, Abinay R. Naini, Ali N. Salman, Lucas Goncalves}
초록

2024 오디세이 음성 정서 인식(SER) 챌린지는 전통적인 연기된 상황에서 유도된 데이터셋에 그치지 않고, 자연스러운 음성에서 정서를 인식하는 기술 혁신을 촉진하는 것을 목표로 한다. 본 챌린지는 분류형(Categorical) SER 및 특성형(Attribute) SER 두 가지 트랙을 다루며, 화자 독립적(voice-independent)으로 학습용, 개발용 및 독점적인 테스트 세트를 제공한다. 모든 데이터는 각 트랙에 맞춰 정밀하게 레이블링되어 있으며, 연구자 간의 협업을 통해 실제 환경에서 정확하게 작동하는 SER 기술 개발을 장려한다. 또한, 최신 음성 처리 기술을 활용한 혁신적인 접근 방식 탐색을 촉진한다. 본 논문에서는 기준 모델(Baseline), 랭킹 시스템(Leaderboard), 결과 평가 및 주요 발견에 대한 논의를 상세히 설명한다. 챌린지 웹사이트는 랭킹 시스템, 기준 코드 링크, 사용 가이드 등을 제공하며, 다음 주소에서 확인할 수 있다: https://lab-msp.com/MSP-Podcast_Competition/leaderboard.php

Odyssey 2024 - 음성 감정 인식 챌린지: 데이터셋, 베이스라인 프레임워크 및 결과 | 최신 연구 논문 | HyperAI초신경