HyperAI

مجموعة بيانات المحادثة الصينية CPED

التاريخ

منذ 3 أعوام

المؤسسة

معهد مهندسي الكهرباء والإلكترونيات

رابط النشر

github.com

الترخيص

其他

مساعدة التنزيل
特色图像

CPED، واسمه الكامل هو الحوار الشخصي والعاطفي الصيني، هو أول مجموعة بيانات صينية واسعة النطاق للحوار الشخصي والعاطفي. تتكون مجموعة البيانات من المعرفة متعددة المصادر المتعلقة بالتعاطف والخصائص الشخصية (تغطي المعرفة مثل الجنس، وخمس سمات شخصية، و13 عاطفة، و19 سلوك حوار، و10 سيناريوهات).

تحتوي مجموعة البيانات على:

  • 133000 خطاب سياقي متعدد الوسائط
  • أكثر من 12000 محادثة من 392 متحدثًا عبر 40 برنامجًا تلفزيونيًا
  • شرح 3 سمات شخصية (الاسم والجنس والعمر)، شرح خمس سمات شخصية، شرح 2 معلومات عاطفية ديناميكية (العاطفة والعاطفة) وشرح DA
  • ثلاث مهام: التعرف على الشخصية في المحادثة (PRC)، والتعرف على المشاعر في المحادثة (ERC)، والمحادثة الشخصية والعاطفية (PEC)