Command Palette

Search for a command to run...

NonverbalTTS 비언어적 오디오 생성 데이터 세트

날짜

3달 전

크기

3.06 GB

논문 URL

arxiv.org

라이선스

Apache 2.0

*이 데이터 세트는 온라인 사용을 지원합니다.여기를 클릭하여 이동하세요.

NonverbalTTS는 VK Lab과 Yandex가 2025년에 발표한 비언어적 오디오 생성 데이터 세트입니다. 관련 논문 결과는 다음과 같습니다.NonverbalTTS: 텍스트 음성 변환을 위한 감정 주석이 포함된 텍스트 정렬 비언어적 발화의 공개 영어 코퍼스"는 표현력이 풍부한 텍스트-오디오(TTS) 연구를 촉진하고 감정과 비언어적 소리가 포함된 자연스러운 음성을 생성하는 모델을 지원하는 것을 목표로 합니다.

이 데이터 세트에는 2,296명의 참가자(남성 60%, 여성 40%)로부터 수집한 17시간 분량의 고품질 음성 데이터가 포함되어 있으며, 호흡, 웃음, 한숨, 재채기, 기침, 목 가다듬기, 신음, 웅얼거림, 코골이, 흡입 등 10가지 비언어적 음성 유형과 분노, 혐오, 두려움, 행복, 중립, 슬픔, 놀람, 기타 등 8가지 감정 범주가 포함됩니다.

데이터 세트 기능:

  • 다중 소스 데이터: VoxCeleb 및 Expresso corpora에서 파생됨
  • 풍부한 메타데이터: 감정 태그, 비언어적 음성 주석, 화자 ID, 오디오 품질 측정 항목
  • 샘플링 속도: VoxCeleb 오디오의 경우 16kHz, Expresso 오디오의 경우 48kHz
NonverbalTTS.torrent
시딩 1다운로드 중 0완료됨 23총 다운로드 횟수 86
  • NonverbalTTS/
    • README.md
      1.77 KB
    • README.txt
      3.55 KB
      • data/
        • NonverbalTTS.zip
          3.06 GB

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
NonverbalTTS 비언어적 오디오 생성 데이터 세트 | 데이터셋 | HyperAI초신경