HyperAIHyperAI
منذ 15 أيام

HowSumm: مجموعة بيانات لتلخيص المستندات المتعددة مشتقة من مقالات WikiHow

Odellia Boni, Guy Feigenblat, Guy Lev, Michal Shmueli-Scheuer, Benjamin Sznajder, David Konopnicki
HowSumm: مجموعة بيانات لتلخيص المستندات المتعددة مشتقة من مقالات WikiHow
الملخص

نقدم "HowSumm"، وهو مجموعة بيانات كبيرة ومبتكرة لمهام التلخيص متعدد الوثائق المُركّز على الاستفسار (qMDS)، والتي تهدف إلى إنشاء تعليمات قابلة للتنفيذ من مجموعة من المصادر. يختلف هذا السياق التطبيقي عن السياقات المغطاة في مجموعات البيانات الحالية الخاصة بالتلخيص متعدد الوثائق (MDS)، ويُطبّق في السياقات التعليمية والصناعية. وقد استخدمنا أساليب آلية، واستفدنا من الإحصائيات المستمدة من مجموعات بيانات qMDS التي تم إنشاؤها يدويًا، لإنشاء HowSumm من مقالات موقع wikiHow والمصادر التي تشير إليها. ونُفصّل في وصف عملية إنشاء هذه المجموعة، ونناقش السمات الفريدة التي تميّزها عن مجموعات التلخيص الأخرى. وقد أظهرت التقييمات الآلية والبشرية للنماذج المُستخلصة والمُجرّدة في هذه المجموعة أن هناك مجالًا للتحسين.