날짜

일 년 전

크기

3.4 GB

조직

게시 URL

Paper URL

태그

ChildMandarin 데이터 세트는 난카이대학교 컴퓨터과학부 AI 연구소와 인간언어기술연구실(HLT랩)이 2025년에 공개한 3~5세 어린이를 위한 포괄적인 중국어 음성 데이터 세트입니다. 이 데이터 세트는 이 연령대의 중국어 음성 데이터가 부족하다는 문제를 해결하기 위해 설계되었습니다. 관련 논문 결과는 다음과 같습니다.ChildMandarin: 3~5세 어린이를 위한 포괄적인 중국어 음성 데이터 세트"는 어린이 음성 인식 및 화자 검증 등 관련 연구 분야의 발전을 지원하는 것을 목표로 합니다.

데이터 세트 기능:

대용량 데이터: 3~5세 아동 397명, 총 41.25시간 분량의 대화 음성으로, 유사 데이터 세트 중에서 특정 이점을 가짐
광범위한 지리적 범위: 22개 주와 도시에서 데이터를 수집하여 지역적 다양성을 보장하고 다양한 악센트와 언어 습관을 포괄합니다.
자연스럽고 사실적인 상호작용: 부모가 안내하는 대화 수집 방법을 채택하여 자연스러운 의사소통 장면을 시뮬레이션하고 음성을 보다 사실적으로 표현합니다.

소환

@article{zhou2024childmandarin, 제목={ChildMandarin: 3~5세 어린이를 위한 종합 중국어 음성 데이터 세트}, 작성자={Zhou, Jiaming 및 Wang, Shiyao 및 Zhao, Shiwan 및 He, Jiabei 및 Sun, Haoqin 및 Wang, Hui 및 Liu, Cheng 및 Kong, Aobo 및 Guo, Yujie 및 Qin, Yong} 저널={arXiv 사전 출판물 arXiv:2409.18584}, 연도={2024} }

ChildMandarin.torrent

시딩 1다운로드 중 0완료됨 115총 다운로드 수 378

ChildMandarin/
- README.md
  1.64 KB
- README.txt
  3.27 KB

이 데이터셋은 커뮤니티 사용자가 기여한 것이며 교육 및 정보 제공 목적으로만 사용됩니다. 저작권 침해와 관련된 콘텐츠가 있는 경우 [email protected]로 문의하시면 신속하게 검토 및 삭제 처리하겠습니다.

undefined

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

HyperAI

이 데이터셋 사용

Discord에서 논의하기

날짜

일 년 전

크기

3.4 GB

조직

게시 URL

Paper URL

태그

데이터 세트 기능:

대용량 데이터: 3~5세 아동 397명, 총 41.25시간 분량의 대화 음성으로, 유사 데이터 세트 중에서 특정 이점을 가짐
광범위한 지리적 범위: 22개 주와 도시에서 데이터를 수집하여 지역적 다양성을 보장하고 다양한 악센트와 언어 습관을 포괄합니다.
자연스럽고 사실적인 상호작용: 부모가 안내하는 대화 수집 방법을 채택하여 자연스러운 의사소통 장면을 시뮬레이션하고 음성을 보다 사실적으로 표현합니다.

소환

ChildMandarin.torrent

시딩 1다운로드 중 0완료됨 115총 다운로드 수 378

ChildMandarin/
- README.md
  1.64 KB
- README.txt
  3.27 KB

undefined

MAKIEVAL 다국어 문화 지식 평가 데이터 세트

15일 전

SAM 3D 아티스트 객체 3D 객체 재구성 데이터 세트

21일 전

ChartNet 차트를 이용한 다중 모달 데이터셋 이해

한 달 전

TACK 타겟 키메라 지식 기반 데이터 세트

한 달 전

SMOL 다국어 번역 병렬 데이터 세트

한 달 전

chi-bench 의료 지능형 에이전트 벤치마크 평가 데이터 세트

한 달 전

ViMU 비디오 은유 이해 데이터셋

한 달 전

MemLens 멀티모달 장기 컨텍스트 벤치마크 데이터셋

한 달 전

Claw-Eval 실세계 벤치마크 데이터셋

2달 전

장거리 산불 및 연기 감지 데이터 세트

2달 전

RSRCC 원격 감지 영역 변화 이해 벤치마크 데이터 세트

24일 전

BRIGHT 재난 건물 평가 데이터 세트

24일 전

OmniParsingBench 멀티모달 구문 분석 기능 평가 데이터 세트

24일 전

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

Command Palette

ChildMandarin 어린이 중국어 대화 음성 데이터 세트

데이터 세트 기능:

소환

AI로 AI 구축

HyperAI Newsletters

Command Palette

ChildMandarin 어린이 중국어 대화 음성 데이터 세트

데이터 세트 기능:

소환

undefined

MAKIEVAL 다국어 문화 지식 평가 데이터 세트

SAM 3D 아티스트 객체 3D 객체 재구성 데이터 세트

ChartNet 차트를 이용한 다중 모달 데이터셋 이해

TACK 타겟 키메라 지식 기반 데이터 세트

SMOL 다국어 번역 병렬 데이터 세트

chi-bench 의료 지능형 에이전트 벤치마크 평가 데이터 세트

ViMU 비디오 은유 이해 데이터셋

MemLens 멀티모달 장기 컨텍스트 벤치마크 데이터셋

Claw-Eval 실세계 벤치마크 데이터셋

장거리 산불 및 연기 감지 데이터 세트

RSRCC 원격 감지 영역 변화 이해 벤치마크 데이터 세트

BRIGHT 재난 건물 평가 데이터 세트

OmniParsingBench 멀티모달 구문 분석 기능 평가 데이터 세트

AI로 AI 구축

HyperAI Newsletters

Command Palette

ChildMandarin 어린이 중국어 대화 음성 데이터 세트

데이터 세트 기능:

소환

undefined

MAKIEVAL 다국어 문화 지식 평가 데이터 세트

SAM 3D 아티스트 객체 3D 객체 재구성 데이터 세트

ChartNet 차트를 이용한 다중 모달 데이터셋 이해

TACK 타겟 키메라 지식 기반 데이터 세트

SMOL 다국어 번역 병렬 데이터 세트

chi-bench 의료 지능형 에이전트 벤치마크 평가 데이터 세트

ViMU 비디오 은유 이해 데이터셋

MemLens 멀티모달 장기 컨텍스트 벤치마크 데이터셋

Claw-Eval 실세계 벤치마크 데이터셋

장거리 산불 및 연기 감지 데이터 세트

RSRCC 원격 감지 영역 변화 이해 벤치마크 데이터 세트

BRIGHT 재난 건물 평가 데이터 세트

OmniParsingBench 멀티모달 구문 분석 기능 평가 데이터 세트

AI로 AI 구축

HyperAI Newsletters

undefined

MAKIEVAL 다국어 문화 지식 평가 데이터 세트

SAM 3D 아티스트 객체 3D 객체 재구성 데이터 세트

ChartNet 차트를 이용한 다중 모달 데이터셋 이해

TACK 타겟 키메라 지식 기반 데이터 세트

SMOL 다국어 번역 병렬 데이터 세트

chi-bench 의료 지능형 에이전트 벤치마크 평가 데이터 세트

ViMU 비디오 은유 이해 데이터셋

MemLens 멀티모달 장기 컨텍스트 벤치마크 데이터셋

Claw-Eval 실세계 벤치마크 데이터셋

장거리 산불 및 연기 감지 데이터 세트

RSRCC 원격 감지 영역 변화 이해 벤치마크 데이터 세트

BRIGHT 재난 건물 평가 데이터 세트

OmniParsingBench 멀티모달 구문 분석 기능 평가 데이터 세트

undefined

MAKIEVAL 다국어 문화 지식 평가 데이터 세트

SAM 3D 아티스트 객체 3D 객체 재구성 데이터 세트

ChartNet 차트를 이용한 다중 모달 데이터셋 이해

TACK 타겟 키메라 지식 기반 데이터 세트

SMOL 다국어 번역 병렬 데이터 세트

chi-bench 의료 지능형 에이전트 벤치마크 평가 데이터 세트

ViMU 비디오 은유 이해 데이터셋

MemLens 멀티모달 장기 컨텍스트 벤치마크 데이터셋

Claw-Eval 실세계 벤치마크 데이터셋

장거리 산불 및 연기 감지 데이터 세트

RSRCC 원격 감지 영역 변화 이해 벤치마크 데이터 세트

BRIGHT 재난 건물 평가 데이터 세트

OmniParsingBench 멀티모달 구문 분석 기능 평가 데이터 세트