HyperAIHyperAI
منذ 2 أشهر

نقل النمط الرسمي شبه المشرف مع التدريب على الثبات

Ao Liu; An Wang; Naoaki Okazaki
نقل النمط الرسمي شبه المشرف مع التدريب على الثبات
الملخص

التحويل الأسلوبي الرسمي (FST) هو مهمة تشمل إعادة صياغة الجمل غير الرسمية إلى جمل رسمية دون تغيير معناها. لمعالجة مشكلة نقص البيانات في المجموعات المتوازية الحالية، تميل الدراسات السابقة إلى اعتماد مخطط إعادة بناء الدورة لاستخدام بيانات إضافية غير مصنفة، حيث يستفيد نموذج التحويل الأسلوبي الرسمي بشكل أساسي من الجمل غير المصنفة على الجانب المستهدف. في هذا العمل، نقترح إطارًا شبه مراقب بسيطًا ومعتمدًا على التدريب الثابت لتحسين استخدام الجمل غير المصنفة على الجانب المصدر. بصفة خاصة، يعزز نهجنا البيانات شبه المتوازية التي تم الحصول عليها من جملة غير رسمية على الجانب المصدر من خلال إلزام النموذج بإنتاج مخرجات مماثلة لنسختها المزعجة (perturbed version). بالإضافة إلى ذلك، قمنا بفحص تأثيرات مختلف طرق تشويب البيانات (data perturbation) بشكل تجريبي واقترحنا استراتيجيات فلترة بيانات فعالة لتحسين إطارنا. أظهرت النتائج التجريبية على مقاييس GYAFC أن نهجنا يمكنه تحقيق أفضل النتائج حتى مع أقل من 40٪ من البيانات المتوازية.

نقل النمط الرسمي شبه المشرف مع التدريب على الثبات | أحدث الأوراق البحثية | HyperAI