منذ 7 أشهر

الملخص

في هذا البحث، نقدم طريقة تعلم هجينة لتدريب أنظمة الحوار الموجهة نحو المهام من خلال التفاعلات عبر الإنترنت مع المستخدمين. من بين الطرق الشائعة لتعلم حوار المهام الموجهة، هناك تطبيق التعلم التعزيزي باستخدام ملاحظات المستخدم على نماذج التدريب الإشرافي الأولية. قد تعاني كفاءة مثل هذه الطرق للتعلم من عدم التطابق في توزيع حالة الحوار بين مرحلة التدريب غير المتصل (أوفلاين) ومرحلة التعلم التفاعلي المتصل (أونلاين). لمعالجة هذا التحدي، نقترح طريقة تعلم هجينة تجمع بين التعلم التقليدي والتعلم التعزيزي، والتي يمكن من خلالها أن يتعلم وكيل الحوار بفعالية من تفاعله مع المستخدمين عن طريق الاستفادة من التعليم البشري والملاحظات. قمنا بتصميم وكيل حوار موجه نحو المهام يستند إلى شبكة عصبية يمكن تحسينه بشكل شامل باستخدام الطريقة المقترحة للتعلم. أظهرت النتائج التجريبية أن وكيل الحوارات لدينا يمكنه التعلم بفعالية من الأخطاء التي يرتكبها عبر التعلم التقليدي من تعليمات المستخدم. استخدام التعلم التعزيزي مع ملاحظات المستخدم بعد مرحلة التعلم التقليدي يحسن بشكل أكبر قدرة الوكيل على إكمال المهمة بنجاح.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Bing Liu; Gokhan Tur; Dilek Hakkani-Tur; Pararth Shah; Larry Heck

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Bing Liu; Gokhan Tur; Dilek Hakkani-Tur; Pararth Shah; Larry Heck

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Bing Liu; Gokhan Tur; Dilek Hakkani-Tur; Pararth Shah; Larry Heck

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

تعلم الحوار مع التدريس والرد البشري في أنظمة الحوار الموجه نحو المهام القابلة للتدريب من البداية إلى النهاية

Bing Liu; Gokhan Tur; Dilek Hakkani-Tur; Pararth Shah; Larry Heck

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

تعلم الحوار مع التدريس والرد البشري في أنظمة الحوار الموجه نحو المهام القابلة للتدريب من البداية إلى النهاية

Bing Liu; Gokhan Tur; Dilek Hakkani-Tur; Pararth Shah; Larry Heck

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

تعلم الحوار مع التدريس والرد البشري في أنظمة الحوار الموجه نحو المهام القابلة للتدريب من البداية إلى النهاية

Bing Liu; Gokhan Tur; Dilek Hakkani-Tur; Pararth Shah; Larry Heck

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters