الانتباه المُوجّه إلى الموضع والبيانات المُراقبة يُحسّنان ملء الفتحات

يُعد المعرفة المرتبطة بشكل علاقة في شكل "مخططات المعرفة" أمرًا مهمًا لعدة تطبيقات. ومع ذلك، تطور القدرة على ملء قواعد المعرفة بالحقائق المستخلصة تلقائيًا من الوثائق كان بطيئًا جدًا. تتناول هذه الورقة بشكل متزامن مشكلتين عانتا منهما الأبحاث السابقة. نحن نقترح أولًا نموذجًا جديدًا فعّالًا، يدمج نموذج تسلسل LSTM مع نوع من الانتباه المُدرك لموقع الكيانات، والذي يكون أكثر ملاءمة لاستخراج العلاقات. ثم نُنشئ TACRED، وهو مجموعة بيانات مُعلَّمة كبيرة (119,474 مثالًا) تم الحصول عليها من خلال التوظيف الجماعي وتركز على علاقات TAC KBP. ونتيجةً لدمج بيانات مُعلَّمة أفضل مع نموذج أكثر ملاءمة وعالي القدرة، تتحسن أداء استخراج العلاقات بشكل كبير. عند استبدال المكون السابق لاستخراج العلاقات في أفضل نظام لملء الفراغات في TAC KBP 2015 باستخدام هذا النموذج الجديد، يرتفع متوسط الدقة (F1) بشكل ملحوظ من 22.2% إلى 26.7%.