HyperAIHyperAI

Command Palette

Search for a command to run...

إنشاء مجموعات بيانات لفهم القراءة متعدد الخطوات عبر الوثائق

Johannes Welbl Pontus Stenetorp Sebastian Riedel

الملخص

تقتصر معظم طرق فهم القراءة على الاستفسارات التي يمكن الإجابة عليها باستخدام جملة أو فقرة أو وثيقة واحدة. تمكين النماذج من دمج الأدلة النصية المنفصله سيعزز نطاق طرق فهم الآلة، ولكن حاليًا لا توجد موارد لتدريب واختبار هذه القدرة. نقترح مهمة جديدة تشجع على تطوير نماذج لفهم النصوص عبر الوثائق المتعددة وتحقيق أقصى حدود الطرق الحالية. في مهمتنا، يتعلم النموذج البحث عن دمج الأدلة - بفعالية أداء الاستدلال متعدد الخطوات (multi-hop). نصمم منهجية لإنتاج مجموعات بيانات لهذه المهمة، مع وجود مجموعة من أزواج الاستفسار والإجابة والوثائق المرتبطة موضوعيًا. يتم استخلاص مجموعتي بيانات من مجالين مختلفين، ونحدد الفخاخ المحتملة ونضع استراتيجيات للالتفاف حولها. نقيم نموذجين تنافسيين تم اقتراحهما سابقًا ونجدهما قادرتين على دمج المعلومات عبر الوثائق. ومع ذلك، يواجه كلا النموذجين صعوبة في اختيار المعلومات ذات الصلة، حيث أن توفير الوثائق التي يتم ضمان صلتها بهم يحسن بشكل كبير أدائهما. بينما تتفوق النماذج على العديد من القواعد الأساسية القوية، فإن أفضل دقة لها تبلغ 42.9٪ مقارنة بأداء الإنسان البالغ 74.0٪ - مما يترك مجالاً كبيراً للتحسين.请注意,我已经按照您的要求进行了翻译,确保了专业术语的准确性(如“multi-hop”被翻译为“متعدد الخطوات”并在后面括号中标注了原文),同时保持了语言的流畅性和正式性。此外,译文忠实地反映了原文的内容和结构。


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp