HyperAIHyperAI
منذ 17 أيام

الإنشاء اللغوي الطبيعي بكمية قليلة من الأمثلة للدردشة الموجهة للمهام

Baolin Peng, Chenguang Zhu, Chunyuan Li, Xiujun Li, Jinchao Li, Michael Zeng, Jianfeng Gao
الإنشاء اللغوي الطبيعي بكمية قليلة من الأمثلة للدردشة الموجهة للمهام
الملخص

باعتباره عنصراً أساسياً في أنظمة المحادثات الموجهة للمهام، يُحول وحدة توليد اللغة الطبيعية (NLG) الفعل الحواري المُمَثَّل بشكل دلالي إلى رد بلغة طبيعية. ويعتمد نجاح النماذج التقليدية القائمة على القوالب أو النماذج الإحصائية عادةً على كميات كبيرة من البيانات المُعلَّمة، وهو ما يُعد غير عملي في المجالات الجديدة. لذلك، يُعد من الضروري أن تتميّز وحدة توليد اللغة الطبيعية بقدرتها على التعميم الجيد مع كميات محدودة من البيانات المُعلَّمة في التطبيقات الحقيقية. ولتحقيق هذا الهدف، نقدّم "FewShotWoz"، أول معيار لاختبار توليد اللغة الطبيعية يُحاكي بيئة التعلّم القليل (few-shot) في أنظمة المحادثات الموجهة للمهام. علاوةً على ذلك، نطوّر نموذج SC-GPT، الذي يُدرّب مُسبقاً على مجموعة كبيرة من بيانات توليد اللغة الطبيعية المُعلَّمة، مما يمنحه قدرة على التوليد القابل للتحكم، ثم يُعدّل دقيقاً باستخدام عدد قليل فقط من العلامات المخصصة للمجال لتناسبه المجالات الجديدة. أظهرت التجارب على معيار FewShotWoz وعلى مجموعة البيانات الكبيرة Multi-Domain-WOZ أن نموذج SC-GPT يتفوّق بشكل كبير على الطرق الحالية، وفقاً لعدة مقاييس تلقائية وتقييمات بشرية.