HyperAIHyperAI

Command Palette

Search for a command to run...

WildSpeech-Bench 음성 이해 생성 벤치마크 데이터 세트

날짜

7달 전

크기

169.51 MB

조직

Tencent AI Lab
腾讯

Paper URL

2506.21875

라이선스

CC BY 4.0

WildSpeech-Bench는 Tencent가 2025년에 발표한 SpeechLLM의 음성 대 음성 기능을 평가하는 최초의 벤치마크입니다. 관련 논문 결과는 다음과 같습니다.WildSpeech-Bench: 실제 환경에서의 종단 간 SpeechLLM 벤치마킹"는 실제 음성 상호 작용 시나리오에서 음성 입력에서 음성 출력까지 완전한 음성 입력을 이해하고 생성하는 모델 능력(음성 대 음성, S2S)을 측정하는 것을 목표로 합니다. 이 데이터셋은 정보 질의, 해결 요청, 의견 교환, 텍스트 생성, 준언어적 표현의 다섯 가지 주요 범주에 걸쳐 1,100개의 질의를 포함합니다. 각 범주는 공통적인 사용자 의도에 해당합니다. 이 중 1,000개는 일반적인 음성 상호작용 시나리오(정보 질의, 해결 요청, 의견 교환, 텍스트 생성 포함)에서 추출되었으며, 나머지 100개는 멈춤, 억양, 더듬거림, 그리고 음성에 가까운 단어 인식과 같은 준언어적 특징을 특징으로 합니다. 각 질의에는 다양한 화자 속성(성별, 연령, 음성 변형), 음향 조건, 소음 환경 설정을 포함하는 다양한 음성 출력 예시가 함께 제공되어 자연스러운 음성 상호작용의 다양성과 어려움을 더욱 현실적으로 시뮬레이션합니다.

데이터셋 구축 과정
데이터셋 구축 과정

WildSpeech-Bench.torrent
시딩 1다운로드 중 1완료됨 0총 다운로드 수 84
  • WildSpeech-Bench/
    • README.md
      1.83 KB
    • README.txt
      3.66 KB
      • data/
        • WildSpeech-Bench.zip
          169.51 MB

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
WildSpeech-Bench 음성 이해 생성 벤치마크 데이터 세트 | 데이터 세트 | HyperAI초신경