التعلم القياسي العصبي لاستخراج العلاقات من النهاية إلى النهاية بسرعة

استخراج العلاقات (RE) هو مهمة استخراج المعلومات الأساسية في عدة تخصصات. عادةً ما يفترض نماذج RE أن عملية تحديد الكيانات المسماة (NER) قد تم تنفيذها في خطوة سابقة بواسطة نموذج مستقل آخر. هناك العديد من الجهود الحديثة، تحت عنوان استخراج العلاقات من النهاية إلى النهاية، تسعى للاستفادة من الارتباطات بين المهام من خلال نمذجة مهام NER وRE بشكل مشترك. كانت الأعمال السابقة في هذا المجال تقلل غالبًا من المهمة إلى مشكلة ملء الجدول حيث يتم تطبيق خطوة فك التشفير باهظة الثمن تتضمن البحث الشعاعي للحصول على تصنيفات خلايا متسقة عالميًا. وفي الجهود التي لا تعتمد على ملء الجداول، لا يزال التحسين العالمي على شكل CRFs مع فك التشفير باستخدام Viterbi ضروريًا لتحقيق أداء تنافسي. نقدم هندسة عصبية جديدة تستفيد من بنية الجدول، وتقوم على تطبيقات متكررة للالتفاف二维卷积(2D convolutions)用于汇集局部依赖性和基于度量的特征,从而在不需要全局优化的情况下改进了最先进水平。我们在ADE和CoNLL04数据集上验证了我们的模型,用于端到端的关系抽取,并展示了相对于先前最佳结果约1%的增益(以F分数衡量),同时训练和测试时间快七到十倍——后者对于时间敏感的最终用户应用程序具有极大的优势。为了确保术语的准确性,以下是部分术语的补充说明:- 二维卷积 (2D convolutions)- 端到端 (end-to-end)修正后的阿拉伯语翻译如下:نقدم هندسة عصبية جديدة تستفيد من بنية الجدول، وتقوم على تطبيقات متكررة للالتفاف الثنائي الأبعاد (2D convolutions) لجمع الخصائص المحلية المعتمدة والمعتمدة على المقاييس، مما يحسن الحالة الحالية للفن دون الحاجة إلى التحسين العالمي. قمنا بتحقق نموذجنا على مجموعتي بيانات ADE وCoNLL04 لاستخراج العلاقات من النهاية إلى النهاية وأظهرنا زيادة بنسبة حوالي 1% (وفقاً لمقياس F) بالمقارنة مع أفضل النتائج السابقة، مع وقت تدريب واختبار أسرع بمقدار سبعة إلى عشرة أضعاف — وهو أمر ذو أهمية كبيرة للتطبيقات المستخدمة من قبل المستخدم النهائي الحساسة للوقت.