GETT-QA: تحويلة T2T تعتمد على تضمين الرسوم البيانية للإجابة على الأسئلة المتعلقة بالرسوم البيانية المعرفية

في هذه الدراسة، نقدم نظامًا شاملًا لأسئلة المعرفة الرسومية (KGQA) يُسمى GETT-QA. يستخدم نظام GETT-QA نموذج T5، وهو نموذج لغوي مُدرّب مسبقًا على نمط النص إلى النص، شائع الاستخدام. يأخذ النموذج سؤالًا باللغة الطبيعية كمدخل، ويُنتج شكلًا مبسطًا من الاستعلام المطلوب باللغة SPARQL. في هذا الشكل المبسط، لا يُنتج النموذج مباشرةً معرفات الكيانات والعلاقات (entity and relation IDs)، بل يُنتج العناوين (labels) المقابلة للكيانات والعلاقات. ثم يتم ربط هذه العناوين بقيم معرفات الكيانات والعلاقات في المعرفة الرسومية (KG) في خطوة لاحقة. ولتحسين النتائج بشكل أكبر، نُوجّه النموذج لإنتاج نسخة مقطوعة من تمثيلات المعرفة الرسومية (KG embedding) لكل كيان. تُمكّن هذه التمثيلات المقطوعة من إجراء بحث أدق في مراحل التمييز بين المعاني (disambiguation). وجدنا أن نموذج T5 قادر على تعلّم هذه التمثيلات المقطوعة دون أي تعديل في دالة الخسارة (loss function)، مما يُحسّن أداء نظام KGQA. ونتيجة لذلك، نُقدّم نتائج قوية على مجموعتي بيانات LC-QuAD 2.0 وSimpleQuestions-Wikidata في تطبيقات KGQA الشاملة على معرفة ويكidata.