نماذج اللغة كتمثيلات للمعرفة

تمثيلات المعرفة (KE) تمثل رسم بياني للمعرفة (KG) من خلال غمر الكيانات والعلاقات في فضاءات متجهية مستمرة. تركز الأساليب الحالية بشكل أساسي على الهيكل أو الوصف. تتعلم الأساليب القائمة على الهيكل تمثيلات تحافظ على البنية الذاتية لرسومات المعرفة. ومع ذلك، لا يمكنها تمثيل الكيانات الطويلة الذيل بكفاءة في رسومات المعرفة الحقيقية التي تحتوي على معلومات هيكلية محدودة. أما الأساليب القائمة على الوصف فتستفيد من المعلومات النصية ونماذج اللغة. لم تكن الأساليب السابقة في هذا الاتجاه قادرة على تحقيق أداء أفضل بكثير من الأساليب القائمة على الهيكل، وكانت تعاني من مشاكل مثل التحليل السلبي الباهظ الثمن والطلب الوصفي المقيد. في هذه الورقة البحثية، نقترح LMKE، وهو يستخدم نماذج اللغة لاستخراج تمثيلات المعرفة، بهدف تحسين تمثيل الكيانات الطويلة الذيل وحل مشاكل الأساليب الوصفية السابقة. نصيغ عملية تعلم تمثيلات المعرفة القائمة على الوصف باستخدام إطار تعلم التباين لتحسين كفاءة التدريب والتقييم. أظهرت النتائج التجريبية أن LMKE حقق أداءً يتفوق على الأداء الحالي في مقاييس تمثيلات المعرفة للتنبؤ بالروابط تصنيف الثلاثيات، خاصة بالنسبة للكيانات الطويلة الذيل.