التبسيط القابل للتحكم للجمل

تهدف عملية تبسيط النص إلى جعل النص أسهل في القراءة والفهم من خلال تبسيط القواعد والهيكل مع الحفاظ على المعلومات الأساسية دون تغيير. وغالبًا ما يُنظر إلى هذه المهمة على أنها مهمة عامة وشاملة، حيث يُفترض أن يكون التبسيط نفسه مناسبًا لجميع المستخدمين؛ لكن جمهورًا مختلفًا يمكن أن يستفيد من النص المبسط بطرق متعددة. نُطبّق آلية بارامترية منفصلة تُتيح تحكمًا صريحًا في أنظمة التبسيط المستندة إلى نماذج التسلسل إلى التسلسل (Sequence-to-Sequence). وبهذا، يمكن للمستخدمين التحكم في النتائج التي تُنتجها النموذج بناءً على خصائص مثل الطول، ودرجة إعادة الصياغة، والتعقيد اللفظي، والتعقيد النحوي. كما نُظهر أن اختيار قيم مناسبة لهذه الخصائص يُمكّن النماذج القياسية من التسلسل إلى التسلسل من التفوق على نماذجها التقليدية في معايير تبسيط النص. ونُقدّم نموذجنا، الذي نُسمّيه ACCESS (وهي اختصار لـ Audience-Centric Sentence Simplification، أي تبسيط الجملة المُوجَّهة نحو الجمهور)، والذي حقق أداءً قياسيًا بدرجة SARI قدرها 41.87 على مجموعة بيانات التقييم WikiLarge، مُسجّلًا تحسنًا بنسبة 1.42 نقطة مقارنة بأعلى درجة سابقة مُبلغ عنها.