HyperAI초신경

SeniorTalk 노인 대화용 중국어 음성 데이터 세트

날짜

한 달 전

크기

55.3 MB

기관

발행 주소

github.com

카테고리

SeniorTalk 데이터 세트는 난카이 대학과 베이징 지원 인공지능 연구소가 2025년 3월에 공개한 세계 최초의 중국 초고령자 대화 음성 데이터 세트입니다. 관련 논문 결과는 다음과 같습니다.SeniorTalk: 초고령 노인을 위한 풍부한 주석이 포함된 중국어 대화 데이터 세트". 이 데이터 세트에는 화자 정보, 대화 내용 전사, 타임스탬프(문장 및 단어 단위 포함), 악센트 범주 라벨 등 다차원 상세 주석이 포함되어 있습니다. 이러한 실제 데이터는 노인 음성 신호에 대한 심층 연구 및 노인 음성 상호작용 시스템 최적화에 귀중한 기반을 제공하고, 고령자 친화적 장비, 건강 관리, 노인 보조 케어 로봇 등 관련 산업 발전을 촉진할 것입니다.

주요 특징:

  • 데이터 크기가 큽니다: 202비트, 매우 고령자의 음성 데이터 55.53시간 분량입니다.
  • 광범위한 지리적 범위: 16개 주와 도시에서 데이터를 수집하여 다양한 지역적 특징을 다룹니다.
  • 자연스럽고 실제적인 상호작용: 은퇴, 건강, 삶 등의 주제를 다루며 두 사람 간의 자연스러운 대화를 채택하여 실제 의사소통 상황에 가깝습니다.
노인의 지리적 분포
노인의 연령 및 성별 통계
SeniorTalk.torrent
시딩 1다운로드 중 0완료됨 13총 다운로드 횟수 32
  • SeniorTalk/
    • README.md
      1.78 KB
    • README.txt
      3.56 KB
      • data/
          • .cache/
              • huggingface/
                • .gitignore
                  3.57 KB
                  • download/
                    • .gitattributes.lock
                      3.57 KB
                    • .gitattributes.metadata
                      3.66 KB
                    • README.md.lock
                      3.66 KB
                    • README.md.metadata
                      3.76 KB
                      • data/
                        • test-00000-of-00001.parquet.lock
                          3.76 KB
                        • test-00000-of-00001.parquet.metadata
                          3.88 KB
                        • train-00000-of-00001.parquet.lock
                          3.88 KB
                        • train-00000-of-00001.parquet.metadata
                          4 KB
                        • validation-00000-of-00001.parquet.lock
                          4 KB
                        • validation-00000-of-00001.parquet.metadata
                          4.13 KB
        • .gitattributes
          6.53 KB
        • SeniorTalk.zip
          55.3 MB