HyperAIHyperAI

Command Palette

Search for a command to run...

ChildMandarin 어린이 중국어 대화 음성 데이터 세트

날짜

일 년 전

크기

3.4 GB

조직

北京智源人工智能研究院

게시 URL

github.com

Paper URL

arxiv.org

ChildMandarin 데이터 세트는 난카이대학교 컴퓨터과학부 AI 연구소와 인간언어기술연구실(HLT랩)이 2025년에 공개한 3~5세 어린이를 위한 포괄적인 중국어 음성 데이터 세트입니다. 이 데이터 세트는 이 연령대의 중국어 음성 데이터가 부족하다는 문제를 해결하기 위해 설계되었습니다. 관련 논문 결과는 다음과 같습니다.ChildMandarin: 3~5세 어린이를 위한 포괄적인 중국어 음성 데이터 세트"는 어린이 음성 인식 및 화자 검증 등 관련 연구 분야의 발전을 지원하는 것을 목표로 합니다.

데이터 세트 기능:

  • 대용량 데이터: 3~5세 아동 397명, 총 41.25시간 분량의 대화 음성으로, 유사 데이터 세트 중에서 특정 이점을 가짐
  • 광범위한 지리적 범위: 22개 주와 도시에서 데이터를 수집하여 지역적 다양성을 보장하고 다양한 악센트와 언어 습관을 포괄합니다.
  • 자연스럽고 사실적인 상호작용: 부모가 안내하는 대화 수집 방법을 채택하여 자연스러운 의사소통 장면을 시뮬레이션하고 음성을 보다 사실적으로 표현합니다.
ChildMandarin.torrent
시딩 2다운로드 중 0완료됨 94총 다운로드 수 336
  • ChildMandarin/
    • README.md
      1.64 KB
    • README.txt
      3.27 KB
      • data/
        • ChildMandarin.zip
          3.4 GB

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp