OpenUE: أداة مفتوحة لاستخراج عالمي من النص

يغطي معالجة اللغة الطبيعية طيفًا واسعًا من المهام التي تتطلب فهمًا على مستوى الرموز (tokens) أو على مستوى الجملة. في هذه الورقة البحثية، نقدّم رؤية بسيطة تُظهر أن معظم المهام يمكن تمثيلها باستخدام تنسيق استخراج موحد واحد. ونقدّم نموذجًا أوليًا، بالإضافة إلى أداة مفتوحة المصدر قابلة للتوسع تُسمى OpenUE، مخصصة لمختلف مهام الاستخراج. تسمح أداة OpenUE للمطوّرين بتدريب نماذج مخصصة لاستخراج المعلومات من النصوص، كما تدعم التحقق السريع من النماذج للباحثين. علاوةً على ذلك، توفر OpenUE وحدات وظيفية متنوعة تضمن مرونة وقابلية للتوسع كافية. وبالإضافة إلى الأداة، قمنا بنشر عرض تجريبي عبر الإنترنت يعتمد على واجهات برمجة تطبيقات RESTful، مما يتيح استخراج المعلومات في الوقت الفعلي دون الحاجة إلى التدريب أو النشر. علاوةً على ذلك، يمكن للنظام عبر الإنترنت استخراج المعلومات في مهام متنوعة، منها استخراج ثلاثيات العلاقات، وكشف الحقول (slots) والنية، واستخراج الأحداث، وغيرها. ونُطلق الكود المصدري، والبيانات، والنماذج المُدرّبة مسبقًا لتعزيز الأبحاث المستقبلية عبر الرابط: http://github.com/zjunlp/openue.