ScisummNet: قاعدة بيانات كبيرة مصحوبة بالشروحات ونماذج تأثير المحتوى لملخصات الأوراق العلمية مع شبكات الاستشهادات

تلخيص المقالات العلمية يمثل تحديًا: لا تتوفر مجموعات بيانات كبيرة ومصححة، ويجب أن يتضمن الملخص المثالي تأثيرات المقال على المجتمع البحثي. يقدم هذا البحث حلولًا جديدة لهذه التحديين. أولاً، قمنا بتطوير وإصدار أول مجموعة بيانات كبيرة ومصححة يدويًا للمقالات العلمية (في مجال علم الحاسوب اللغوي) من خلال تمكين التصحيح الأسرع، وثانيًا، اقترحنا طرق تلخيص تدمج العناوين الرئيسية الأصلية للمؤلفين (الملخص) والتأثيرات الفعلية للمقال على المجتمع (الاستشهادات)، لإنشاء ملخصات شاملة هجينة. نجري تجارب لبيان فعالية مجموعتنا البيانات في تدريب النماذج القائمة على البيانات لتلخيص المقالات العلمية، ولإظهار أفضلية ملخصاتنا الهجينة على الملخصات التقليدية والاستشهادات. توفر مجموعتنا البيانات الكبيرة والمصححة وطرقنا الهجينة إطارًا جديدًا لأبحاث تلخيص المقالات العلمية.