توسيع تحليل اللغة الطبيعية من خلال تمثيلات العلاقات الفاصلة

معالجة اللغات الطبيعية تغطي مجموعة واسعة من المهام التي تتضمن التنبؤ بالتركيب النحوي، الدلالة المعجمية، ومحتوى المعلومات، وفي الغالب يتم إنتاج كل نوع من أنواع الإخراج باستخدام هياكل مصممة خصيصًا لهذا الغرض. في هذا البحث، نقدم رؤية بسيطة مفادها أنه يمكن تمثيل مجموعة كبيرة من المهام في تنسيق موحد واحد يتكون من وضع علامات على فواصل النص والعلاقات بين هذه الفواصل، وبالتالي يمكن استخدام نموذج مستقل عن المهمة عبر مختلف المهام. نقوم بإجراء تجارب واسعة لاختبار هذه الرؤية على 10 مهام مختلفة تشمل تحليل الارتباطات (التركيب النحوي)، تصنيف الأدوار الدلالية (الدلالة المعجمية)، استخراج العلاقات (محتوى المعلومات)، تحليل المشاعر القائمة على الجوانب (المشاعر)، وغيرها الكثير، مما يحقق أداءً مماثلاً لأفضل النماذج المتخصصة. كما نوضح فوائد التعلم متعدد المهام، ونظهر أيضًا أن الطريقة المقترحة تسهل تحليل الاختلافات والتشابهات في كيفية التعامل مع النموذج مع مختلف المهام. وأخيرًا، نحول هذه القواعد البيانات إلى تنسيق موحد لبناء مقاييس مرجعية، والتي توفر بيئة اختبار شاملة لتقييم النماذج المستقبلية لتحليل اللغات الطبيعية العام.