HyperAIHyperAI
منذ شهر واحد

تعلم الحوار مع التدريس والرد البشري في أنظمة الحوار الموجه نحو المهام القابلة للتدريب من البداية إلى النهاية

Bing Liu; Gokhan Tur; Dilek Hakkani-Tur; Pararth Shah; Larry Heck
تعلم الحوار مع التدريس والرد البشري في أنظمة الحوار الموجه نحو المهام القابلة للتدريب من البداية إلى النهاية
الملخص

في هذا البحث، نقدم طريقة تعلم هجينة لتدريب أنظمة الحوار الموجهة نحو المهام من خلال التفاعلات عبر الإنترنت مع المستخدمين. من بين الطرق الشائعة لتعلم حوار المهام الموجهة، هناك تطبيق التعلم التعزيزي باستخدام ملاحظات المستخدم على نماذج التدريب الإشرافي الأولية. قد تعاني كفاءة مثل هذه الطرق للتعلم من عدم التطابق في توزيع حالة الحوار بين مرحلة التدريب غير المتصل (أوفلاين) ومرحلة التعلم التفاعلي المتصل (أونلاين). لمعالجة هذا التحدي، نقترح طريقة تعلم هجينة تجمع بين التعلم التقليدي والتعلم التعزيزي، والتي يمكن من خلالها أن يتعلم وكيل الحوار بفعالية من تفاعله مع المستخدمين عن طريق الاستفادة من التعليم البشري والملاحظات. قمنا بتصميم وكيل حوار موجه نحو المهام يستند إلى شبكة عصبية يمكن تحسينه بشكل شامل باستخدام الطريقة المقترحة للتعلم. أظهرت النتائج التجريبية أن وكيل الحوارات لدينا يمكنه التعلم بفعالية من الأخطاء التي يرتكبها عبر التعلم التقليدي من تعليمات المستخدم. استخدام التعلم التعزيزي مع ملاحظات المستخدم بعد مرحلة التعلم التقليدي يحسن بشكل أكبر قدرة الوكيل على إكمال المهمة بنجاح.

تعلم الحوار مع التدريس والرد البشري في أنظمة الحوار الموجه نحو المهام القابلة للتدريب من البداية إلى النهاية | أحدث الأوراق البحثية | HyperAI