TransferTransfo: نهج التعلم النقل لوكلاء المحادثة القائمة على الشبكات العصبية

نقدم نهجًا جديدًا للأنظمة الحوارية القائمة على البيانات التوليدية (مثل الروبوتات الدردشة) يُعرف باسم TransferTransfo، وهو مزيج من مخطط تدريب يستند إلى التعلم النقل (Transfer Learning) ونموذج Transformer ذي القدرة العالية. يتم ضبط النموذج الدقيق باستخدام هدف متعدد المهام يجمع بين عدة مهام تنبؤ غير مشرف. أظهر النموذج المُضبط دقةً تحسينات قوية على الأنظمة الحوارية الحالية التي تعتمد على طرق النهاية إلى النهاية مثل أنظمة seq2seq المعززة بالذاكرة وأنظمة استرجاع المعلومات. في مجموعة البيانات PERSONA-CHAT الخاصة بالتحدي الثاني لذكاء المحادثة، حقق هذا النهج مستوى جديدًا من الطليعية، حيث سجلت مقاييس الالتباس (Perplexity)، والضرب في الأول (Hits@1)، ومقياس F1 القيم التالية: 16.28 (تحسين بنسبة 45% مطلقة)، 80.7 (تحسين بنسبة 46% مطلقة)، و19.5 (تحسين بنسبة 20% مطلقة).