HyperAIHyperAI
منذ 17 أيام

استخلاص مشترك للكيانات والعلاقات بناءً على استراتيجية تفكيك جديدة

Bowen Yu, Zhenyu Zhang, Xiaobo Shu, Yubin Wang, Tingwen Liu, Bin Wang, Sujian Li
استخلاص مشترك للكيانات والعلاقات بناءً على استراتيجية تفكيك جديدة
الملخص

يهدف الاستخراج المشترك للكيانات والعلاقات إلى اكتشاف أزواج الكيانات مع علاقاتها باستخدام نموذج واحد. وعادةً ما يُعالج هذا المهمة في السابق بطريقة "الاستخراج ثم التصنيف" أو بطريقة التسمية الموحّدة. لكن هذه الأساليب تعاني إما من وجود أزواج كيانات زائدة، أو تتجاهل البنية الداخلية المهمة أثناء عملية استخراج الكيانات والعلاقات. ولحل هذه القيود، نقوم في هذا البحث أولاً بتفكيك مهمة الاستخراج المشترك إلى مهام فرعية مترابطة، تُعرف بـ "استخراج HE" و"استخراج TER". وتكمن المهمة الفرعية الأولى في التمييز بين جميع الكيانات الرئيسية التي قد تكون مشاركة في علاقات مستهدفة، بينما تتمثل المهمة الفرعية الثانية في تحديد الكيانات النهائية والعلاقات المرتبطة بكل كيان رئيسي تم استخراجه. ثم يتم تفكيك هاتين المهمتين الفرعيتين إلى عدة مسائل تسمية تسلسلية بناءً على مخطط التسمية القائم على الفواصل (span-based tagging) الذي نقترحه، والتي يمكن حلها بسهولة باستخدام مُحدِّد الحدود الهرمي وخوارزمية فك التسمية متعددة الفواصل. وبفضل الاستراتيجية المعقولة للفك، يمكن لنموذجنا التقاط الترابط الدلالي الكامل بين الخطوات المختلفة، كما يقلل من الضوضاء الناتجة عن أزواج الكيانات غير ذات صلة. وأظهرت النتائج التجريبية أن طريقةنا تتفوق على الطرق السابقة بنسبة 5.2% و5.9% و21.5% (بمقياس F1)، محققةً حالة متقدمة جديدة (state-of-the-art) على ثلاث مجموعات بيانات عامة.

استخلاص مشترك للكيانات والعلاقات بناءً على استراتيجية تفكيك جديدة | أحدث الأوراق البحثية | HyperAI