HyperAIHyperAI

Command Palette

Search for a command to run...

تعلم الحوار مع التدريس والرد البشري في أنظمة الحوار الموجه نحو المهام القابلة للتدريب من البداية إلى النهاية

Bing Liu; Gokhan Tur; Dilek Hakkani-Tur; Pararth Shah; Larry Heck

الملخص

في هذا البحث، نقدم طريقة تعلم هجينة لتدريب أنظمة الحوار الموجهة نحو المهام من خلال التفاعلات عبر الإنترنت مع المستخدمين. من بين الطرق الشائعة لتعلم حوار المهام الموجهة، هناك تطبيق التعلم التعزيزي باستخدام ملاحظات المستخدم على نماذج التدريب الإشرافي الأولية. قد تعاني كفاءة مثل هذه الطرق للتعلم من عدم التطابق في توزيع حالة الحوار بين مرحلة التدريب غير المتصل (أوفلاين) ومرحلة التعلم التفاعلي المتصل (أونلاين). لمعالجة هذا التحدي، نقترح طريقة تعلم هجينة تجمع بين التعلم التقليدي والتعلم التعزيزي، والتي يمكن من خلالها أن يتعلم وكيل الحوار بفعالية من تفاعله مع المستخدمين عن طريق الاستفادة من التعليم البشري والملاحظات. قمنا بتصميم وكيل حوار موجه نحو المهام يستند إلى شبكة عصبية يمكن تحسينه بشكل شامل باستخدام الطريقة المقترحة للتعلم. أظهرت النتائج التجريبية أن وكيل الحوارات لدينا يمكنه التعلم بفعالية من الأخطاء التي يرتكبها عبر التعلم التقليدي من تعليمات المستخدم. استخدام التعلم التعزيزي مع ملاحظات المستخدم بعد مرحلة التعلم التقليدي يحسن بشكل أكبر قدرة الوكيل على إكمال المهمة بنجاح.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp