HyperAIHyperAI
منذ 2 أشهر

إنشاء مجموعات بيانات لفهم القراءة متعدد الخطوات عبر الوثائق

Johannes Welbl; Pontus Stenetorp; Sebastian Riedel
إنشاء مجموعات بيانات لفهم القراءة متعدد الخطوات عبر الوثائق
الملخص

تقتصر معظم طرق فهم القراءة على الاستفسارات التي يمكن الإجابة عليها باستخدام جملة أو فقرة أو وثيقة واحدة. تمكين النماذج من دمج الأدلة النصية المنفصله سيعزز نطاق طرق فهم الآلة، ولكن حاليًا لا توجد موارد لتدريب واختبار هذه القدرة. نقترح مهمة جديدة تشجع على تطوير نماذج لفهم النصوص عبر الوثائق المتعددة وتحقيق أقصى حدود الطرق الحالية. في مهمتنا، يتعلم النموذج البحث عن دمج الأدلة - بفعالية أداء الاستدلال متعدد الخطوات (multi-hop). نصمم منهجية لإنتاج مجموعات بيانات لهذه المهمة، مع وجود مجموعة من أزواج الاستفسار والإجابة والوثائق المرتبطة موضوعيًا. يتم استخلاص مجموعتي بيانات من مجالين مختلفين، ونحدد الفخاخ المحتملة ونضع استراتيجيات للالتفاف حولها. نقيم نموذجين تنافسيين تم اقتراحهما سابقًا ونجدهما قادرتين على دمج المعلومات عبر الوثائق. ومع ذلك، يواجه كلا النموذجين صعوبة في اختيار المعلومات ذات الصلة، حيث أن توفير الوثائق التي يتم ضمان صلتها بهم يحسن بشكل كبير أدائهما. بينما تتفوق النماذج على العديد من القواعد الأساسية القوية، فإن أفضل دقة لها تبلغ 42.9٪ مقارنة بأداء الإنسان البالغ 74.0٪ - مما يترك مجالاً كبيراً للتحسين.请注意,我已经按照您的要求进行了翻译,确保了专业术语的准确性(如“multi-hop”被翻译为“متعدد الخطوات”并在后面括号中标注了原文),同时保持了语言的流畅性和正式性。此外,译文忠实地反映了原文的内容和结构。

إنشاء مجموعات بيانات لفهم القراءة متعدد الخطوات عبر الوثائق | أحدث الأوراق البحثية | HyperAI