HyperAIHyperAI

مجموعة بيانات حوار لعب الأدوار في ChatHaruhi-RolePlaying

التاريخ

منذ 2 أعوام

الحجم

93.83 MB

رابط الورقة البحثية

arxiv.org

العلامات

特色图像

* هذه المجموعة من البيانات تدعم الاستخدام عبر الإنترنت.انقر هنا للقفز.

ChatHaruhi عبارة عن مجموعة بيانات تحتوي على 32 شخصية تلفزيونية/أنمي صينية/إنجليزية وأكثر من 54 ألف حوار محاكي.

لقد جذبت روبوتات الدردشة التي تعتمد على لعب الأدوار والمصممة باستخدام نماذج لغوية كبيرة اهتمامًا واسع النطاق، ولكن هناك حاجة إلى تقنيات أكثر تقدمًا لتقليد شخصيات خيالية محددة. واقترح الباحثون خوارزمية تتحكم في نموذج اللغة من خلال تحسين الإشارات وذاكرة الأحرف المستخرجة من النص. ومن خلال جمع مجموعات من الأفلام والروايات والنصوص وإجراء استخلاص منظم، جمع الباحثون أكثر من 23 ألف رسالة محادثة. يمكن استخدام بيانات المحادثة هذه لتدريب واختبار نماذج اللغة للعب الأدوار. وفي الوقت نفسه، وباستخدام الخوارزمية التي اقترحها الباحثون وبمساعدة GPT3 وGPT4، تمكن الباحثون من إنشاء أكثر من 27 ألف حوار إضافي لهذه الشخصيات.

ChatHaruhi-لعب الأدوار.torrent
البذر 1التنزيل 0مكتمل 286إجمالي التنزيلات 1,027
  • ChatHaruhi-RolePlaying/
    • README.md
      1.45 KB
    • README.txt
      2.9 KB
      • data/
        • ChatHaruhi-RolePlaying.zip
          93.83 MB
مجموعة بيانات حوار لعب الأدوار في ChatHaruhi-RolePlaying | مجموعات البيانات | HyperAI