منذ 15 أيام
HowSumm: مجموعة بيانات لتلخيص المستندات المتعددة مشتقة من مقالات WikiHow
Odellia Boni, Guy Feigenblat, Guy Lev, Michal Shmueli-Scheuer, Benjamin Sznajder, David Konopnicki

الملخص
نقدم "HowSumm"، وهو مجموعة بيانات كبيرة ومبتكرة لمهام التلخيص متعدد الوثائق المُركّز على الاستفسار (qMDS)، والتي تهدف إلى إنشاء تعليمات قابلة للتنفيذ من مجموعة من المصادر. يختلف هذا السياق التطبيقي عن السياقات المغطاة في مجموعات البيانات الحالية الخاصة بالتلخيص متعدد الوثائق (MDS)، ويُطبّق في السياقات التعليمية والصناعية. وقد استخدمنا أساليب آلية، واستفدنا من الإحصائيات المستمدة من مجموعات بيانات qMDS التي تم إنشاؤها يدويًا، لإنشاء HowSumm من مقالات موقع wikiHow والمصادر التي تشير إليها. ونُفصّل في وصف عملية إنشاء هذه المجموعة، ونناقش السمات الفريدة التي تميّزها عن مجموعات التلخيص الأخرى. وقد أظهرت التقييمات الآلية والبشرية للنماذج المُستخلصة والمُجرّدة في هذه المجموعة أن هناك مجالًا للتحسين.