HyperAIHyperAI
منذ 2 أشهر

MUSS: تبسيط الجمل متعدد اللغات من خلال استخراج التعبيرات المكافئة

Louis Martin; Angela Fan; Éric de la Clergerie; Antoine Bordes; Benoît Sagot
MUSS: تبسيط الجمل متعدد اللغات من خلال استخراج التعبيرات المكافئة
الملخص

تقدم مبسط الجمل قد عُقِّدَ بسبب نقص البيانات المبسطة المتوازية والمصنفة، خاصة في اللغات الأخرى غير الإنجليزية. نقدم نظام MUSS (Multilingual Unsupervised Sentence Simplification)، وهو نظام تبسيط جمل متعدد اللغات لا يحتاج إلى بيانات تبسيط مصنفة. يستخدم MUSS منهجًا جديدًا لتبسيط الجمل يعتمد على تدريب نماذج قوية باستخدام بيانات التعبير عن الجمل بدلاً من البيانات البسيطة المناسبة. تعتمد هذه النماذج على التدريب غير المشرف والآليات القابلة للتحكم في التوليد لتكييف السمات مثل الطول والتعقيد اللفظي بمرنة أثناء الاستدلال. كما نقدم طريقة لاستخراج مثل هذه بيانات التعبير عن الجمل في أي لغة من Common Crawl باستخدام تمثيلات جملية معنوية، مما يلغي الحاجة إلى البيانات المصنفة. نقيم منهجنا على مقاييس تبسيط الإنجليزية والفرنسية والإسبانية ونتطابق بشكل وثيق أو نتفوق على أفضل النتائج السابقة التي تم إشرافها، رغم عدم استخدامنا لأي بيانات تبسيط مصنفة. ندفع الحالة الفنية إلى الأمام أكثر بإدخال البيانات المبسطة المصنفة.

MUSS: تبسيط الجمل متعدد اللغات من خلال استخراج التعبيرات المكافئة | أحدث الأوراق البحثية | HyperAI