HyperAIHyperAI
منذ 11 أيام

التعلم المُعزّز بالهيكل لتمثيل النصوص لإنجاز مكتمل لرسوم المعرفة بكفاءة

Bo Wang, Tao Shen, Guodong Long, Tianyi Zhou, Yi Chang
التعلم المُعزّز بالهيكل لتمثيل النصوص لإنجاز مكتمل لرسوم المعرفة بكفاءة
الملخص

توفر الرسوم المعرفية التي تم تجميعها يدويًا معلومات داعمة حيوية لمختلف مهام معالجة اللغة الطبيعية، لكن هذه الرسوم غالبًا ما تكون غير كاملة، مما يدفع إلى الحاجة إلى تكميلها تلقائيًا. تُعدّ النماذج الشائعة لتمثيل الرسوم مثل TransE، التي تتعلم المعرفة الهيكلية من خلال تمثيل عناصر الرسم البياني في تمثيلات كثيفة واعتبار العلاقات على مستوى الثلاثيات باستخدام المسافة المكانية، غير قادرة على التعميم على العناصر التي لم تُرى أثناء التدريب، وهي أيضًا عرضة بشكل أساسي لمشكلة عدم اكتمال الرسم البياني. في المقابل، تلجأ النماذج القائمة على الترميز النصي، مثل KG-BERT، إلى النص المرتبط بالثلاثيات وتمثيلات سياقية على مستوى الثلاثيات. وتتمتع هذه النماذج بقدر عالٍ من التعميم والمقاومة لعدم اكتمال الرسم البياني، خاصة عند دمجها مع مشغلات مُدرّبة مسبقًا. لكنها تعاني من عيبين رئيسيين يحدان من أدائها: (1) التكاليف العالية الناتجة عن عملية تقييم جميع الثلاثيات الممكنة أثناء الاستدلال، و(2) نقص المعرفة الهيكلية في مشغل الترميز النصي. في هذه الورقة، نتبع نموذج الترميز النصي ونهدف إلى تخفيف هذه العيوب من خلال تعزيزه بتقنيات تمثيل الرسوم البيانية — أي نموذج هجين مكمل يجمع بين كلا النموذجين. بشكل محدد، نقسم كل ثلاثية إلى جزأين غير متماثلين كما في نموذج تمثيل الرسوم القائم على الترجمة، ونُمثّل كلا الجزأين باستخدام مشغل نصي من نوع سياميز يعتمد على التمثيل السياقي. وباستناد إلى هذه التمثيلات، يستخدم نموذجنا كلاً من فاصل محدد (deterministic classifier) وقياسًا مكانيًا (spatial measurement) لتعلم التمثيل والهيكل على التوالي. علاوة على ذلك، طوّرنا خطة تجميع تلقائية التكيّف (self-adaptive ensemble scheme) لتحسين الأداء أكثر من خلال دمج درجات الثلاثيات المستمدة من نموذج تمثيل رسم بياني موجود مسبقًا. في التجارب، حققنا أداءً يُعدّ من أفضل النماذج على ثلاث معايير (benchmarks) وبيانات تجريبية بدون تدريب (zero-shot dataset) لمهام توقع الروابط، مع تسجيل تقليل كبير في تكاليف الاستدلال بمقدار 1 إلى 2 رتبة من التMagnitude مقارنةً بمنهجية الترميز النصي.

التعلم المُعزّز بالهيكل لتمثيل النصوص لإنجاز مكتمل لرسوم المعرفة بكفاءة | أحدث الأوراق البحثية | HyperAI