منذ شهر واحد
التمييز بين الكيانات العالمية باستخدام BERT
Ikuya Yamada; Koki Washio; Hiroyuki Shindo; Yuji Matsumoto

الملخص
نقترح نموذج توضيح كيانات عالمي (Global Entity Disambiguation - GED) يستند إلى BERT. للاستيلاء على المعلومات السياقية العالمية لتوضيح الكيانات، يعالج نموذجنا ليس الكلمات فحسب، بل أيضًا الكيانات كرموز إدخال، وينجز المهمة من خلال حل الإشارات تباعًا إلى كياناتها المرجعية واستخدام الكيانات المحصلة كإدخالات في كل خطوة. ندرب النموذج باستخدام مكتبة ضخمة من الكيانات المُشَرَّحة التي تم الحصول عليها من ويكيبيديا. حققنا نتائج جديدة رائدة على خمسة مجموعات بيانات قياسية لتوضيح الكيانات: AIDA-CoNLL، MSNBC، AQUAINT، ACE2004، وWNED-WIKI. يمكن الوصول إلى الشفرة المصدرية ونقطة التحقق من النموذج عبر الرابط https://github.com/studio-ousia/luke.