HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 4 أشهر

استخدام تحريرات ويكيبيديا في تصحيح الأخطاء النحوية في الموارد المنخفضة

{Adriane Boyd}

استخدام تحريرات ويكيبيديا في تصحيح الأخطاء النحوية في الموارد المنخفضة

الملخص

نُطوّر نظامًا لتصحيح الأخطاء النحوية (GEC) باللغة الألمانية باستخدام مجموعة صغيرة من البيانات المُصَحَّحة يدويًا (الـ gold GEC) تم توسيعها بتعديلات استُخلِصت من سجلات التعديلات في ويكيبيديا. ونُوسِّع أداة التصنيف التلقائي للأخطاء ERRANT (Bryant et al., 2017) لدعم اللغة الألمانية، ونستخدمها لتحليل كل من التصويبات المُصَحَّحة يدويًا في مجموعة البيانات الذهبية وتعديلات ويكيبيديا (Grundkiewicz و Junczys-Dowmunt, 2014)، بهدف اختيار تعديلات ويكيبيديا كبيانات تدريب إضافية تحتوي على تصويبات نحوية مشابهة لتلك الموجودة في المجموعة الذهبية. وباستخدام نموذج GEC يعتمد على شبكة عصبية مُشفَّرة-مُفكَّكة متعددة الطبقات (Chollampatt و Ng, 2018)، نقيّم مساهمة تعديلات ويكيبيديا، ونجد أن تعديلات ويكيبيديا المختارة بعناية تُحسِّن الأداء بنسبة تزيد عن 5%.

المعايير القياسية

معيار قياسيالمنهجيةالمقاييس
grammatical-error-correction-on-falko-merlinMultilayer Convolutional Encoder-Decoder
F0.5: 43.35

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
استخدام تحريرات ويكيبيديا في تصحيح الأخطاء النحوية في الموارد المنخفضة | الأوراق البحثية | HyperAI