AxCell: استخراج تلقائي للنتائج من أوراق البحث في التعلم الآلي

تعقب التقدم في تعلم الآلة أصبح أكثر صعوبة مع الزيادة المتسارعة في عدد الأوراق البحثية مؤخرًا. في هذا البحث، نقدم نظام AxCell، وهو أنبوب عمليات تعلم آلي مصمم لاستخراج النتائج من الأوراق البحثية. يستخدم AxCell عدة مكونات جديدة، بما في ذلك مهمة تقسيم الجداول (table segmentation subtask)، لتعلم المعرفة الهيكلية ذات الصلة التي تسهل عملية الاستخراج. عند مقارنته بالطرق الموجودة حاليًا، يحسن نهجنا بشكل كبير الحالة الفنية لاستخراج النتائج. كما نقوم بإصدار مجموعة بيانات منظمة ومصحوبة بتعليقات للتدريب على نماذج استخراج النتائج، ومجموعة بيانات أخرى لتقييم أداء هذه النماذج في هذه المهمة. وأخيرًا، نوضح جدوى نهجنا مما يجعله قابلًا للاستخدام في استخراج النتائج شبه الآلي في الإنتاج، مما يشير إلى أن تحسيناتنا تجعل هذه المهمة قابلة للتطبيق العملي لأول مرة. الكود متاح على موقع GitHub.