이 데이터셋 사용

Discord에서 논의하기

날짜

9달 전

크기

389.35 GB

조직

Paper URL

라이선스

Apache 2.0

태그

음성 및 음성 처리

ShiftySpeech는 존스홉킨스 대학교에서 2025년에 발표한 대규모 합성 음성 감지 벤치마크입니다. 관련 논문의 제목은 "ShiftySpeech: 분포 변화를 적용한 대규모 합성 음성 데이터 세트이 연구의 목적은 언어, 화자, 생성 모델, 녹음 조건의 변화를 포함하는 '분포 드리프트' 상황에서 실제 세계에서 음성 합성 감지 모델의 일반화 능력을 조사하는 것입니다. 이 데이터 세트에는 3,000시간 이상의 합성 음성 데이터가 포함되어 있으며, 읽기 스타일, 팟캐스트, YouTube 녹음, 배경 소음이나 비표준 녹음 조건이 있는 기타 시나리오, 그리고 언어, 화자 연령, 억양, 성별의 차이를 포함한 7개 소스 도메인을 포괄합니다. 이 데이터는 세 가지 언어(영어, 중국어, 일본어)를 포함하며, 6개의 TTS(텍스트 음성 변환) 시스템과 12개의 보코더(보코더/파형 생성기)를 사용하여 다양한 수준의 시스템 분포 드리프트를 생성했습니다.

소환

@article{garg2025shiftyspeech, 제목={ShiftySpeech: 분포 변화를 포함하는 대규모 합성 음성 데이터셋}, 저자={Garg, Ashi 및 Cai, Zexin 및 Zhang, Lin 및 Xinyuan, Henry Li 및 Garc{'\i}a-Perera, Leibny Paola 및 Duh, Kevin 및 Khudanpur, Sanjeev 및 Wiesner, Matthew 및 Andrews, Nicholas}, 저널={arXiv 사전 출판물 arXiv:2502.05674}, 연도={2025} }

ShiftySpeech.torrent

시딩 1다운로드 중 0완료됨 4총 다운로드 수 133

ShiftySpeech/
- README.md
  1.6 KB
- README.txt
  3.2 KB

이 데이터셋은 커뮤니티 사용자가 기여한 것이며 교육 및 정보 제공 목적으로만 사용됩니다. 저작권 침해와 관련된 콘텐츠가 있는 경우 [email protected]로 문의하시면 신속하게 검토 및 삭제 처리하겠습니다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

이 데이터셋 사용

Discord에서 논의하기

날짜

9달 전

크기

389.35 GB

조직

Paper URL

라이선스

Apache 2.0

태그

음성 및 음성 처리

ShiftySpeech는 존스홉킨스 대학교에서 2025년에 발표한 대규모 합성 음성 감지 벤치마크입니다. 관련 논문의 제목은 "ShiftySpeech: 분포 변화를 적용한 대규모 합성 음성 데이터 세트이 연구의 목적은 언어, 화자, 생성 모델, 녹음 조건의 변화를 포함하는 '분포 드리프트' 상황에서 실제 세계에서 음성 합성 감지 모델의 일반화 능력을 조사하는 것입니다. 이 데이터 세트에는 3,000시간 이상의 합성 음성 데이터가 포함되어 있으며, 읽기 스타일, 팟캐스트, YouTube 녹음, 배경 소음이나 비표준 녹음 조건이 있는 기타 시나리오, 그리고 언어, 화자 연령, 억양, 성별의 차이를 포함한 7개 소스 도메인을 포괄합니다. 이 데이터는 세 가지 언어(영어, 중국어, 일본어)를 포함하며, 6개의 TTS(텍스트 음성 변환) 시스템과 12개의 보코더(보코더/파형 생성기)를 사용하여 다양한 수준의 시스템 분포 드리프트를 생성했습니다.

소환

@article{garg2025shiftyspeech, 제목={ShiftySpeech: 분포 변화를 포함하는 대규모 합성 음성 데이터셋}, 저자={Garg, Ashi 및 Cai, Zexin 및 Zhang, Lin 및 Xinyuan, Henry Li 및 Garc{'\i}a-Perera, Leibny Paola 및 Duh, Kevin 및 Khudanpur, Sanjeev 및 Wiesner, Matthew 및 Andrews, Nicholas}, 저널={arXiv 사전 출판물 arXiv:2502.05674}, 연도={2025} }

ShiftySpeech.torrent

시딩 1다운로드 중 0완료됨 4총 다운로드 수 133

ShiftySpeech/
- README.md
  1.6 KB
- README.txt
  3.2 KB

이 데이터셋은 커뮤니티 사용자가 기여한 것이며 교육 및 정보 제공 목적으로만 사용됩니다. 저작권 침해와 관련된 콘텐츠가 있는 경우 [email protected]로 문의하시면 신속하게 검토 및 삭제 처리하겠습니다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

ShiftySpeech 음성 분포 평가 데이터 세트 | 데이터 세트 | HyperAI초신경