التصنيف الدقيق للغاية للعناصر الكيانية

نقدم مهمة تصنيف كيانات جديدة: بالنظر إلى جملة تحتوي على ذكر لكيان، الهدف هو التنبؤ بمجموعة من العبارات الحرة (مثل برج شاهق، كاتب أغاني، أو مجرم) التي تصف أنواعًا مناسبة للكيان المستهدف. يسمح هذا الصياغة باستخدام نوع جديد من الإشراف البعيد على نطاق واسع: الكلمات الرئيسية، والتي تشير إلى نوع الجمل الاسمية التي تظهر فيها. نوضح أن هذه الأنواع الدقيقة للغاية يمكن الحصول عليها من خلال العمل الجماعي، ونقدم مجموعات تقييم جديدة أكثر تنوعًا ودقة من المعايير الموجودة حاليًا. نقدم نموذجًا يمكنه التنبؤ بأنواع مفتوحة، وهو مدرب باستخدام هدف متعدد المهام يجمع بين إشرافنا الجديد على الكلمات الرئيسية والإشراف السابق من ربط الكيانات. تُظهر النتائج التجريبية أن نموذجنا فعال في التنبؤ بأنواع الكيانات بمستويات مختلفة من الدقة؛ حيث حقق أداءً يتفوق على أفضل ما تم تحقيقه سابقًا في معيار تصنيف الكيانات الدقيق الموجود حاليًا، وأقام خطوط أساس لمجموعات البيانات الجديدة التي قمنا بتقديمها. يمكن تنزيل بياناتنا والنماذج الخاصة بنا من: http://nlp.cs.washington.edu/entity_type