مجموعة بيانات حوار لعب الأدوار في ChatHaruhi-RolePlaying

* هذه المجموعة من البيانات تدعم الاستخدام عبر الإنترنت.انقر هنا للقفز.
ChatHaruhi عبارة عن مجموعة بيانات تحتوي على 32 شخصية تلفزيونية/أنمي صينية/إنجليزية وأكثر من 54 ألف حوار محاكي.
لقد جذبت روبوتات الدردشة التي تعتمد على لعب الأدوار والمصممة باستخدام نماذج لغوية كبيرة اهتمامًا واسع النطاق، ولكن هناك حاجة إلى تقنيات أكثر تقدمًا لتقليد شخصيات خيالية محددة. واقترح الباحثون خوارزمية تتحكم في نموذج اللغة من خلال تحسين الإشارات وذاكرة الأحرف المستخرجة من النص. ومن خلال جمع مجموعات من الأفلام والروايات والنصوص وإجراء استخلاص منظم، جمع الباحثون أكثر من 23 ألف رسالة محادثة. يمكن استخدام بيانات المحادثة هذه لتدريب واختبار نماذج اللغة للعب الأدوار. وفي الوقت نفسه، وباستخدام الخوارزمية التي اقترحها الباحثون وبمساعدة GPT3 وGPT4، تمكن الباحثون من إنشاء أكثر من 27 ألف حوار إضافي لهذه الشخصيات.
ChatHaruhi-RolePlaying.torrent
البذر 1التنزيل 2مكتمل 185إجمالي التنزيلات 742