HyperAI

SeniorTalk Chinesischer Sprachdatensatz Für Gespräche Älterer Menschen

Datum

vor einem Monat

Größe

55.3 MB

Organisation

Veröffentlichungs-URL

github.com

Kategorien

Der SeniorTalk-Datensatz ist der weltweit erste chinesische Sprachdatensatz für sehr ältere Menschen, der im März 2025 von der Nankai-Universität und dem Beijing Zhiyuan Artificial Intelligence Research Institute veröffentlicht wurde. Die zugehörigen Ergebnisse der Studie sind:SeniorTalk: Ein chinesischer Konversationsdatensatz mit umfangreichen Anmerkungen für sehr betagte Senioren". Der Datensatz enthält mehrdimensionale detaillierte Anmerkungen, darunter Sprecherinformationen, Transkription von Gesprächsinhalten, Zeitstempel (einschließlich Satz- und Wortebene), Akzentkategoriebezeichnungen usw. Diese realen Daten werden eine wertvolle Unterstützung für die eingehende Erforschung der Sprachsignale älterer Menschen und die Optimierung von Sprachinteraktionssystemen für ältere Menschen darstellen und die Entwicklung verwandter Branchen wie altersgerechter Geräte, Gesundheitsmanagement und Roboter für die unterstützte Altenpflege fördern.

Hauptmerkmale:

  • Die Datenmenge ist groß: 202 Bit, 55,53 Stunden Sprachdaten von sehr alten Menschen.
  • Breite geografische Abdeckung: Es werden Daten aus 16 Provinzen und Städten erhoben, die unterschiedliche regionale Akzente abdecken.
  • Natürliche und echte Interaktion: Es handelt sich um einen spontanen Dialog zwischen zwei Personen zu Themen wie Ruhestand, Gesundheit und Leben, der realen Kommunikationsszenarien sehr nahe kommt.
Geografische Verteilung der älteren Menschen
Alters- und Geschlechtsstatistik älterer Menschen
SeniorTalk.torrent
Seeding 2Herunterladen 0Abgeschlossen 13Gesamtdownloads 32
  • SeniorTalk/
    • README.md
      1.78 KB
    • README.txt
      3.56 KB
      • data/
          • .cache/
              • huggingface/
                • .gitignore
                  3.57 KB
                  • download/
                    • .gitattributes.lock
                      3.57 KB
                    • .gitattributes.metadata
                      3.66 KB
                    • README.md.lock
                      3.66 KB
                    • README.md.metadata
                      3.76 KB
                      • data/
                        • test-00000-of-00001.parquet.lock
                          3.76 KB
                        • test-00000-of-00001.parquet.metadata
                          3.88 KB
                        • train-00000-of-00001.parquet.lock
                          3.88 KB
                        • train-00000-of-00001.parquet.metadata
                          4 KB
                        • validation-00000-of-00001.parquet.lock
                          4 KB
                        • validation-00000-of-00001.parquet.metadata
                          4.13 KB
        • .gitattributes
          6.53 KB
        • SeniorTalk.zip
          55.3 MB