HyperAIHyperAI
منذ 11 أيام

QALD-9-plus: مجموعة بيانات متعددة اللغات للإجابة على الأسئلة عبر DBpedia وWikidata، تم ترجمتها بواسطة متحدثين أصليين

Aleksandr Perevalov, Dennis Diefenbach, Ricardo Usbeck, Andreas Both
QALD-9-plus: مجموعة بيانات متعددة اللغات للإجابة على الأسئلة عبر DBpedia وWikidata، تم ترجمتها بواسطة متحدثين أصليين
الملخص

القدرة على تقديم تجربة متماثلة لمجموعات المستخدمين المختلفة (أي إمكانية الوصول) تعد إحدى أهم الخصائص الخاصة بأنظمة الويب القائمة على الإنترنت. ويُطبَّق هذا المبدأ أيضًا على أنظمة الإجابة على الأسئلة باستخدام الرسوم المعرفية (KGQA)، التي توفر وصولاً إلى بيانات الويب المعنى من خلال واجهة طبيعية باللغة. وبالرغم من متابعتنا لمسار بحثي يركز على الجوانب متعددة اللغات لإمكانية الوصول في أنظمة KGQA، فقد حددنا عدة تحديات قائمة. إحدى هذه التحديات هي نقص المعايير (benchmarks) متعددة اللغات الخاصة بأنظمة KGQA. في هذا العمل، قمنا بتوسيع أحد أكثر معايير KGQA شيوعاً – QALD-9 – من خلال إدخال ترجمات عالية الجودة للأسئلة إلى ثمانٍ من اللغات، قدمها متحدثون أصليون، ونقلنا استعلامات SPARQL الخاصة بـ QALD-9 من DBpedia إلى Wikidata، بهدف تعزيز جودة الاستخدام وملاءمة البيانات بشكل كبير. وبحسب معرفتنا، لم تُدرس لغات خمس – الأرمينية، والأوكرانية، والليتوانية، والباشكيرية، والبيلاروسية – من قبل في مجتمع أبحاث KGQA من قبل. كما أن اللغتين الأخيرتين تُصنَّفان من قبل اليونسكو ضمن اللغات "المهددة بالانقراض". ونطلق على المجموعة الموسعة اسم QALD-9-plus، ونُشرت بشكل مفتوح عبر الإنترنت على الرابط التالي: https://github.com/Perevalov/qald_9_plus.

QALD-9-plus: مجموعة بيانات متعددة اللغات للإجابة على الأسئلة عبر DBpedia وWikidata، تم ترجمتها بواسطة متحدثين أصليين | أحدث الأوراق البحثية | HyperAI