SYGMA: نظام للإجابة العامة على الأسئلة المتعددة الموديولية على قواعد المعرفة

تُعد مهام الاستجابة القائمة على المعرفة (KBQA) التي تتطلب استدلالًا معقدًا اتجاهًا بحثيًا مهمًا في تطور التكنولوجيا. ومع ذلك، تواجه معظم أنظمة KBQA صعوبات في التعميم، خاصة على مستويين: (أ) عبر أنواع متعددة من الاستدلال، حيث ركزت كل من المجموعات البيانات والأنظمة بشكل رئيسي على الاستدلال متعدد الخطوات (multi-hop reasoning)، و(ب) عبر قواعد معرفية متعددة، حيث يتم ضبط مناهج KBQA بشكل خاص على قاعدة معرفية واحدة فقط. في هذه الورقة، نقدّم SYGMA، وهي منهجية معيارية تُسهّل التعميم عبر قواعد معرفية متعددة وأنواع متعددة من الاستدلال. وبشكل دقيق، يتكوّن SYGMA من ثلاث وحدات عليا: 1) وحدة فهم السؤال المستقلة عن قاعدة المعرفة (KB-agnostic question understanding module)، وهي مشتركة بين قواعد المعرفة المختلفة؛ 2) قواعد داعمة لدعم أنواع إضافية من الاستدلال؛ و3) وحدة خصوصية المعرفة في خريطة السؤال والإجابة (KB-specific question mapping and answering module)، والتي تُعالج الجوانب الخاصة بقاعدة المعرفة في استخراج الإجابة. ونُظهر فعالية نظامنا من خلال تقييمه على مجموعات بيانات تنتمي إلى قاعدتي معرفتين مختلفتين، وهما DBpedia وWikidata. بالإضافة إلى ذلك، لبيان قابلية التوسع إلى أنواع إضافية من الاستدلال، قمنا بتقييم النظام على مجموعات بيانات تتعلق بالاستدلال متعدد الخطوات، وبيانات جديدة لاختبار KBQA الزمنية (Temporal KBQA benchmark dataset) على Wikidata، أطلقنا عليها اسم TempQA-WD1، والتي تم تقديمها في هذه الورقة. ونُظهر أن منهجيتنا القابلة للتعميم تحقق أداءً مُنافسًا أفضل على عدة مجموعات بيانات من DBpedia وWikidata، والتي تتطلب كلاً من الاستدلال متعدد الخطوات والاستدلال الزمني.