HyperAIHyperAI
منذ 2 أشهر

النماذج اللغوية الكبيرة تلتقي هاري بوتر: مجموعة بيانات ثنائية اللغة لتوحيد وكلاء الحوار مع الشخصيات

Nuo Chen; Yan Wang; Haiyun Jiang; Deng Cai; Yuhan Li; Ziyang Chen; Longyue Wang; Jia Li
النماذج اللغوية الكبيرة تلتقي هاري بوتر: مجموعة بيانات ثنائية اللغة لتوحيد وكلاء الحوار مع الشخصيات
الملخص

في السنوات الأخيرة، أظهرت نماذج اللغات الكبيرة ذات الأسلوب الحواري (LLMs) مثل ChatGPT و GPT-4 إمكانات هائلة في بناء وكلاء حواريين مفتوحين. ومع ذلك، فإن مواءمة هذه الوكلاء مع شخصيات أو أفراد محددين لا تزال تمثل تحديًا كبيرًا بسبب تعقيدات تمثيل الشخصية ونقص التوضيحات الشاملة. في هذا البحث، نقدم مجموعة بيانات حوار هاري بوتر (HPD)، المصممة لدفع دراسة الوكلاء الحواريين والمواءمة الشخصية. تشمل المجموعة جميع جلسات الحوار (باللغتين الإنجليزية والصينية) من سلسلة هاري بوتر وهي مشمولة بالتوضيحات الأساسية للمعلومات الخلفية، بما في ذلك مشاهد الحوار، المتحدثين، علاقات الشخصيات، والخصائص. قد تمكن هذه التوضيحات الواسعة نماذج اللغات الكبيرة من فتح قدرات حوارية مدفوعة بالشخصية. بالإضافة إلى ذلك، يمكن أن تعمل كمعيار عام لتقييم مدى قدرة النموذج على المواءمة مع شخصية معينة. قمنا بتقييم نماذج اللغات الكبيرة على مجموعة بيانات HPD باستخدام كل من تقنيات التعديل الدقيق (fine-tuning) والتعلم السياقي (in-context learning). تكشف نتائج التقييم أن هناك مجالًا كبيرًا للتحسين في إنتاج réponses عالية الجودة ومتماشية مع الشخصية، إلا أن المجموعة المقترحة هي قيمة في توجيه النماذج نحو Réponses أكثر انسجامًا مع شخصية هاري بوتر.请注意,我在这里对“responses”一词进行了两次翻译,分别使用了“Réponses”这个词的法语形式。这可能是笔误,正确的翻译应该是:تظهر نتائج التقييم أن هناك مجالًا كبيرًا للتحسين في إنتاج ردود عالية الجودة ومتماشية مع الشخصية، إلا أن المجموعة المقترحة هي قيمة في توجيه النماذج نحو ردود أكثر انسجامًا مع شخصية هاري بوتر.

النماذج اللغوية الكبيرة تلتقي هاري بوتر: مجموعة بيانات ثنائية اللغة لتوحيد وكلاء الحوار مع الشخصيات | أحدث الأوراق البحثية | HyperAI