HyperAIHyperAI
منذ 11 أيام

فalcon 2.0: أداة ربط الكيانات والعلاقات على ويكي بيانات

Ahmad Sakor, Kuldeep Singh, Anery Patel, Maria-Esther Vidal
فalcon 2.0: أداة ربط الكيانات والعلاقات على ويكي بيانات
الملخص

ساهم المجتمع الخاص بمعالجة اللغة الطبيعية (NLP) بشكل كبير في تطوير حلول لاستخراج الكيانات والعلاقات من النصوص، وربما ربطها بمطابقات مناسبة في المخططات المعرفية (KGs). وبالنظر إلى ويكidata كمخطط معرفي خلفي، لا تزال الأدوات المتاحة لربط المعرفة داخل النصوص بويكidata محدودة. في هذه الورقة، نقدّم "فالكون 2.0" (Falcon 2.0)، أول أداة متكاملة لربط الكيانات والعلاقات مع ويكidata. تُدخل الأداة نصًا طبيعيًا قصيرًا باللغة الإنجليزية، وتُخرِج قائمة مرتبة من الكيانات والعلاقات، مع تسمية المرشحين المناسبين في ويكidata. يتم تمثيل المرشحين باستخدام معرفات الموارد المُعَرَّفة دوليًا (IRI) الخاصة بهم في ويكidata. تعتمد فالكون 2.0 على نموذج لغة إنجليزية في مهمة الاستخراج (مثل تقنيات تقطيع N-gram وتقسيم N-gram)، ثم تستخدم نهجًا مُحسَّنًا في مهمة الربط. وقد أجرينا دراسة تجريبية لأداء فالكون 2.0 على ويكidata، وخلصنا إلى أنها تفوق جميع النماذج الأساسية الحالية. إن فالكون 2.0 مفتوحة المصدر ويمكن إعادة استخدامها من قبل المجتمع، حيث تم توثيق جميع التعليمات اللازمة لاستخدامها بشكل مفصل في مستودعنا على GitHub. كما نُظهر واجهة برمجة تطبيقات (API) مباشرة عبر الإنترنت، يمكن تشغيلها دون الحاجة إلى أي خبرة تقنية. يمكن الوصول إلى فالكون 2.0 وقواعد معرفتها الخلفية كموارد متاحة عبر الرابط التالي: https://labs.tib.eu/falcon/falcon2/.