HyperAI

مجموعة بيانات الكلام الصيني SeniorTalk لمحادثات كبار السن

التاريخ

منذ شهر واحد

الحجم

55.3 MB

المؤسسة

رابط النشر

github.com

مجموعة بيانات SeniorTalk هي أول مجموعة بيانات محادثة لكبار السن الصينيين في العالم، أصدرتها جامعة نانكاي ومعهد بكين تشي يوان لأبحاث الذكاء الاصطناعي في مارس 2025. نتائج الورقة ذات الصلة هي:SeniorTalk: مجموعة بيانات محادثة باللغة الصينية مع تعليقات توضيحية غنية لكبار السنتحتوي مجموعة البيانات على شروح تفصيلية متعددة الأبعاد، بما في ذلك معلومات المتحدث، ونسخ محتوى المحادثة، والطوابع الزمنية (بما في ذلك مستوى الجملة ومستوى الكلمة)، وتصنيفات فئات اللهجات، وغيرها. ستوفر هذه البيانات الواقعية دعمًا قيّمًا للبحث المتعمق في الإشارات الصوتية لكبار السن وتحسين أنظمة التفاعل الصوتي لهم، وستعزز تطوير الصناعات ذات الصلة، مثل المعدات الملائمة لكبار السن، وإدارة الصحة، وروبوتات رعاية المسنين المساعدة.

الميزات الرئيسية:

  • حجم البيانات كبير: 202 بت، 55.53 ساعة من بيانات الصوت لكبار السن جدًا.
  • تغطية جغرافية واسعة: يتم جمع البيانات من 16 مقاطعة ومدينة، وتغطي لهجات إقليمية مختلفة.
  • التفاعل الطبيعي والواقعي: يعتمد على الحوار العفوي بين شخصين، ويتناول مواضيع مثل التقاعد والصحة والحياة، وهو قريب من سيناريوهات التواصل الحقيقية.
التوزيع الجغرافي لكبار السن
إحصاءات العمر والجنس لكبار السن
SeniorTalk.torrent
البذر 1التنزيل 0مكتمل 13إجمالي التنزيلات 32
  • SeniorTalk/
    • README.md
      1.78 KB
    • README.txt
      3.56 KB
      • data/
          • .cache/
              • huggingface/
                • .gitignore
                  3.57 KB
                  • download/
                    • .gitattributes.lock
                      3.57 KB
                    • .gitattributes.metadata
                      3.66 KB
                    • README.md.lock
                      3.66 KB
                    • README.md.metadata
                      3.76 KB
                      • data/
                        • test-00000-of-00001.parquet.lock
                          3.76 KB
                        • test-00000-of-00001.parquet.metadata
                          3.88 KB
                        • train-00000-of-00001.parquet.lock
                          3.88 KB
                        • train-00000-of-00001.parquet.metadata
                          4 KB
                        • validation-00000-of-00001.parquet.lock
                          4 KB
                        • validation-00000-of-00001.parquet.metadata
                          4.13 KB
        • .gitattributes
          6.53 KB
        • SeniorTalk.zip
          55.3 MB