HyperAIHyperAI
منذ 2 أشهر

CiteFusion: إطار مجمع لتصنيف نية الاستشهاد باستخدام أزواج ثنائية من النماذج الثنائية وتحليلات SHAP

Lorenzo Paolini; Sahar Vahdati; Angelo Di Iorio; Robert Wardenga; Ivan Heibi; Silvio Peroni
CiteFusion: إطار مجمع لتصنيف نية الاستشهاد باستخدام أزواج ثنائية من النماذج الثنائية وتحليلات SHAP
الملخص

فهم الدوافع الكامنة وراء الاقتباسات العلمية أمر ضروري لتقييم أثر البحث وتعزيز التواصل العلمي الشفاف. تقدم هذه الدراسة إطارًا مركبًا جديدًا يُسمى CiteFusion، وهو مصمم لمعالجة مهمة تصنيف نوايا الاقتباس متعددة الفئات على قاعدتين رئيسيتين للبيانات المعيارية: SciCite و ACL-ARC. يستخدم الإطار تقسيمًا واحدًا مقابل الكل (One-vs-All) لمهمة التصنيف متعددة الفئات إلى مهمات ثنائية خاصة بكل فئة، مستفيدًا من أزواج مكملة من نماذج SciBERT و XLNet، التي تم ضبطها بشكل مستقل لكل نية اقتباس. يتم دمج مخرجات هذه النماذج الأساسية من خلال تصنيف فرعي عصبي متقدم لإعادة بناء مهمة التصنيف الأصلية. لتحسين القابلية للتفسير، يتم استخدام SHAP (SHapley Additive exPlanations) لتحليل المساهمات على مستوى العناصر، والتفاعلات بين النماذج الأساسية، مما يوفر شفافية في ديناميكيات التصنيف الخاصة بـ CiteFusion، وأفكار حول أنواع سوء التصنيف في الإطار المركب. بالإضافة إلى ذلك، تدرس هذه الدراسة الدور الدلالي للسياق الهيكلي من خلال دمج عناوين الفقرات كأجهزة تنظيمية في الجمل المدخلة، وتقييم تأثيرها الإيجابي على دقة التصنيف. يظهر CiteFusion أداءً قويًا في السيناريوهات غير المتوازنة وفي حالات ندرة البيانات: تبين النتائج التجريبية أن CiteFusion حقق أفضل الأداء الحالي بمعدل F1 الكلي 89.60% على SciCite، و76.24% على ACL-ARC. علاوة على ذلك، لضمان التوافق والقابلية لإعادة الاستخدام، تم ربط نوايا الاقتباس من كلا جدولتي البيانات بخصائص الأشياء في أونتولوجيا تصنيف الاقتباس (CiTO)، مما يسلط الضوء على بعض التداخلات. وأخيرًا، نصف ونطلق تطبيقًا عبر الإنترنت يقوم بتصنيف نوايا الاقتباس باستخدام نماذج CiteFusion التي تم تطويرها على بيانات SciCite.