HyperAI

*이 데이터 세트는 온라인 사용을 지원합니다.여기를 클릭하여 이동하세요.

NonverbalTTS는 VK Lab과 Yandex가 2025년에 발표한 비언어적 오디오 생성 데이터 세트입니다. 관련 논문 결과는 다음과 같습니다.NonverbalTTS: 텍스트 음성 변환을 위한 감정 주석이 포함된 텍스트 정렬 비언어적 발화의 공개 영어 코퍼스"는 표현력이 풍부한 텍스트-오디오(TTS) 연구를 촉진하고 감정과 비언어적 소리가 포함된 자연스러운 음성을 생성하는 모델을 지원하는 것을 목표로 합니다.

이 데이터 세트에는 2,296명의 참가자(남성 60%, 여성 40%)로부터 수집한 17시간 분량의 고품질 음성 데이터가 포함되어 있으며, 호흡, 웃음, 한숨, 재채기, 기침, 목 가다듬기, 신음, 웅얼거림, 코골이, 흡입 등 10가지 비언어적 음성 유형과 분노, 혐오, 두려움, 행복, 중립, 슬픔, 놀람, 기타 등 8가지 감정 범주가 포함됩니다.

데이터 세트 기능:

다중 소스 데이터: VoxCeleb 및 Expresso corpora에서 파생됨

풍부한 메타데이터: 감정 태그, 비언어적 음성 주석, 화자 ID, 오디오 품질 측정 항목

샘플링 속도: VoxCeleb 오디오의 경우 16kHz, Expresso 오디오의 경우 48kHz

NonverbalTTS 비언어적 오디오 생성 데이터 세트

*이 데이터 세트는 온라인 사용을 지원합니다.여기를 클릭하여 이동하세요.

데이터 세트 기능:

AI로 AI 구축

Hyper Newsletters

Command Palette

NonverbalTTS 비언어적 오디오 생성 데이터 세트

*이 데이터 세트는 온라인 사용을 지원합니다.여기를 클릭하여 이동하세요.

데이터 세트 기능:

AI로 AI 구축

Hyper Newsletters