HyperAIHyperAI
منذ 2 أشهر

فَرْضُ التَّحَزُّبِ الْمُرْتَبِطِ بِالْوَسَمَاتِ لِلتَّصنيفِ النَّوعيِّ الْمُتَقَدِّمِ جِدًّا

Wenhan Xiong; Jiawei Wu; Deren Lei; Mo Yu; Shiyu Chang; Xiaoxiao Guo; William Yang Wang
فَرْضُ التَّحَزُّبِ الْمُرْتَبِطِ بِالْوَسَمَاتِ لِلتَّصنيفِ النَّوعيِّ الْمُتَقَدِّمِ جِدًّا
الملخص

تستغل أنظمة تصنيف الكيانات الحالية عادةً الهرمية النمطية المقدمة من قبل مخطط قاعدة المعرفة (KB) لنمذجة ارتباطات التسميات وبالتالي تحسين الأداء الشامل. ومع ذلك، فإن هذه التقنيات ليست قابلة للتطبيق مباشرة في السيناريوهات الأكثر انفتاحًا وعمليًا حيث لا يُقيد مجموعة الأنواع بمخطط قاعدة المعرفة وتتضمن عددًا ضخمًا من الأنواع الحرة. لنمذجة ارتباطات التسميات الأساسية دون الوصول إلى الهياكل التسمية المشمولة بالتدوين اليدوي، نقدم تحيزًا استقرائيًا جديدًا يتعلق بالتسميات، يتم تمثيله بطبقة انتشار الرسم البياني التي تقوم بتشفير الإحصاءات المشتركة للتسميات على مستوى العالم والتشابهات على مستوى الكلمات بشكل فعال.في مجموعة بيانات كبيرة تحتوي على أكثر من 10,000 نوع حر، يمكن للنموذج المعزز بالرسم البياني والمجهز بوحدة مطابقة تعتمد على الانتباه تحقيق درجة استرجاع أعلى بكثير مع الحفاظ على دقة عالية. تحديدًا، يحقق تحسنًا نسبيًا بنسبة 15.3% في مؤشر F1 ويقلل أيضًا من عدم التناسق في النواتج. كما نوضح أن تعديلًا بسيطًا للمستوى الرسومي المقترح لدينا يمكن أيضًا أن يحسن الأداء في مجموعة بيانات تقليدية ومختبرة على نطاق واسع تتضمن فقط أصناف مخطط قاعدة المعرفة (KB).

فَرْضُ التَّحَزُّبِ الْمُرْتَبِطِ بِالْوَسَمَاتِ لِلتَّصنيفِ النَّوعيِّ الْمُتَقَدِّمِ جِدًّا | أحدث الأوراق البحثية | HyperAI