نهج التحويل من تسلسل إلى تسلسل لاستخراج العلاقات على مستوى الوثيقة

بفضل حقيقة أن العديد من العلاقات تتجاوز حدود الجملة، ازداد الاهتمام باستخراج العلاقات على مستوى الوثيقة (DocRE). يتطلب DocRE دمج المعلومات داخل وعبر الجمل، وإلتقاط التفاعلات المعقدة بين ذكر الكيانات. معظم الأساليب الحالية تعتمد على خطوات متتابعة، وتتطلب الكيانات كمدخلات. ومع ذلك، يمكن أن يحسن التعلم المشترك لاستخراج الكيانات والعلاقات الأداء ويكون أكثر كفاءة بسبب المعلمات المشتركة والخطوات التدريبية. في هذا البحث، نطور نهجًا تسلسليًا، seq2rel، يمكنه تعلم المهام الفرعية لـ DocRE (استخراج الكيانات، حل الإشارة المرجعية والعلاقات) بشكل شامل من البداية إلى النهاية، مما يحل محل سلسلة مكونات خاصة بالمهمة. باستخدام استراتيجية بسيطة نطلق عليها إشارات الكيانات (entity hinting)، نقارن نهجنا مع الأساليب الحالية التي تعتمد على الخطوات المتتابعة على عدة قواعد بيانات طبية شائعة، وفي بعض الحالات نتفوق على أدائها. كما نقدم أول نتائج شاملة من البداية إلى النهاية在这些数据集上供未来比较。最后,我们证明在我们的模型下,全面的方法优于基于步骤的方法。我们的代码、数据和训练模型可在{\url{https://github.com/johngiorgi/seq2rel}}获取。在线演示可在{\url{https://share.streamlit.io/johngiorgi/seq2rel/main/demo.py}}找到。请注意,最后一句中的URL链接部分在阿拉伯语中通常会保留英文格式,以确保链接的可点击性和正确性。以下是修正后的翻译:أخيرًا، نثبت أن الطريقة الشاملة من البداية إلى النهاية تتفوق على الطريقة القائمة على الخطوات المتتابعة في إطار نموذجنا. رمزنا البرمجي والبيانات والنماذج المدربة متاحة على الرابط {\url{https://github.com/johngiorgi/seq2rel}}. ويمكن الحصول على العرض التوضيحي عبر الإنترنت من خلال الرابط {\url{https://share.streamlit.io/johngiorgi/seq2rel/main/demo.py}}.