IAM: مجموعة بيانات شاملة وكبيرة الحجم لمهام تعدين الحجج المتكاملة

تقليديًا، تتطلب المناظرة عملية إعداد يدوي تشمل قراءة العديد من المقالات، واختيار الادعاءات، وتحديد مواقف هذه الادعاءات، والبحث عن الأدلة المؤيدة لها وغيرها. مع زيادة الاهتمام بالمناظرة الذكائية الاصطناعية في السنوات الأخيرة، يستحق استكشاف طرق ل computerization (أتمتة) العملية الشاقة المرتبطة بنظام المناظرة. في هذا العمل، نقدم مجموعة بيانات شاملة وكبيرة تُسمى IAM، والتي يمكن تطبيقها على سلسلة من مهام استخراج الحجج، بما في ذلك استخراج الادعاءات، تصنيف المواقف، واستخراج الأدلة وغيرها. تم جمع بياناتنا من أكثر من 1000 مقال يتعلق بـ 123 موضوعًا. تم تحديد حوالي 70,000 جملة في القاعدة البيانات بشكل كامل بناءً على خصائص حججها (مثل الادعاءات، المواقف، الأدلة وغيرها). نقترح أيضًا مهامين جديدتين متكاملتين مرتبطتين بعملية إعداد المناظرة: (1) استخراج الادعاءات مع تصنيف المواقف (CESC) و(2) استخراج أزواج الادعاء-الدليل (CEPE). نعتمد نهج خطوة بخطوة وطريقة من النهاية إلى النهاية لكل مهمة متكاملة على حدة. تم الإبلاغ عن نتائج تجريبية مشجعة لتوضيح قيمة وتحديات المهام المقترحة لدينا وتحفيز البحث المستقبلي في مجال استخراج الحجج.