HyperAIHyperAI
منذ 16 أيام

فيغغو: مجموعة بيانات لعبة فيديو لتحويل البيانات إلى نص في المحادثات ذات المجال المفتوح

Juraj Juraska, Kevin K. Bowden, Marilyn Walker
فيغغو: مجموعة بيانات لعبة فيديو لتحويل البيانات إلى نص في المحادثات ذات المجال المفتوح
الملخص

أدى انتشار التعلم العميق في توليد اللغة الطبيعية (NLG) إلى إطلاق مجموعة من المجموعات المتوازية الصغيرة والكبيرة نسبيًا لتدريب النماذج العصبية. ومع ذلك، فإن مجموعات البيانات الحالية المُوجهة إلى النص من البيانات مُصممة خصيصًا لأنظمة المحادثة الموجهة للمهام، وغالبًا ما تكون محدودة من حيث التنوع والملاءمة. وتُجمع هذه البيانات غالبًا عبر منصات جماعية، مع بقاء نسبة كبيرة من الضوضاء فيها. علاوة على ذلك، لا تستفيد النماذج العصبية الحالية لـ NLG من البيانات التدريبية الكبيرة بشكل كامل، ونتيجة لخصائصها القوية في التعميم، تُنتج جملًا تبدو وكأنها مُصاغة وفق نماذج مسبقة، بغض النظر. ولذلك، نقدّم مجموعة بيانات جديدة تضم 7000 عينة، تتميز بما يلي: (1) نظافتها رغم جمعها جماعيًا، (2) احتواؤها على عبارات تمثل 9 أنواع من أفعال المحادثة العامة والواقعية، مما يجعلها أكثر ملاءمة لأنظمة المحادثة المفتوحة المجال، و(3) استكشافها لمجال ألعاب الفيديو، وهو مجال جديد بالنسبة لأنظمة المحادثة، على الرغم من إمكاناته الكبيرة في دعم محادثات غنية ومتعددة الجوانب.

فيغغو: مجموعة بيانات لعبة فيديو لتحويل البيانات إلى نص في المحادثات ذات المجال المفتوح | أحدث الأوراق البحثية | HyperAI