HyperAIHyperAI

Command Palette

Search for a command to run...

StepEval 오디오 준언어학적 준언어학적 이해 평가 데이터 세트

날짜

9달 전

크기

440.73 MB

조직

StepFun 阶跃星辰

Paper URL

2507.16632

라이선스

Apache 2.0

StepEval Audio Paralinguistic은 StepFun AI 팀이 2025년에 발표한 오디오 파라링구스틱 이해 평가 데이터 세트입니다. 관련 논문은 "Step-Audio 2 기술 보고서"는 AI 모델이 음성에 포함된 준언어 정보(성별, 나이, 어조, 감정 등)를 이해하는 능력을 평가하는 것을 목표로 합니다. 이 데이터셋은 성별, 연령, 음색, 감정, 음높이, 리듬, 속도, 화법, 발성, 시나리오, 이벤트 유형 등 11가지 작업 차원에 균등하게 분포된 550개의 음성 샘플로 구성되어 있습니다. 처음 8개 작업은 400개의 공개 팟캐스트에서 샘플링한 중국어 오디오 클립을 기반으로 하며, 나머지 3개 작업은 AudioSet(이벤트), CochlScene(환경 장면), VocalSound(음성 효과음)에서 각각 50개의 오디오 샘플을 사용합니다. 모든 샘플은 30초 미만으로 유지되며, 24kHz로 균일하게 리샘플링되고 전문가 팀이 주석을 달았습니다.

StepEval-Audio-Paralinguistic.torrent
시딩 1다운로드 중 0완료됨 24총 다운로드 수 144
  • StepEval-Audio-Paralinguistic/
    • README.md
      1.77 KB
    • README.txt
      3.54 KB
      • data/
        • StepEval-Audio-Paralinguistic.zip
          440.73 MB

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp