تمديد السياق المُوجه بالمنطق وتوسيع البيانات لاستنتاجات منطقية نصية

يتطلب الاستدلال المنطقي في النص فهم المعلومات المنطقية الحاسمة الواردة فيه وإجراء استنتاجات عليها. تركز النماذج الكبيرة المُدرَّبة مسبقًا للتفكير المنطقي بشكل رئيسي على المعاني على مستوى الكلمات في النص، بينما تواجه صعوبة في التقاط المنطق الرمزي. في هذا البحث، نقترح فهم الرموز والتعبيرات المنطقية الواردة في النص للوصول إلى الإجابة الصحيحة. استنادًا إلى هذه المعلومات المنطقية، نقدّم ليس فقط إطارًا لتوسيع السياق، بل نقترح أيضًا خوارزمية لتعزيز البيانات. يمتد الإطار الأول لتوسيع السياق ليشمل التعبيرات المنطقية الضمنية وفقًا لقوانين التكافؤ المنطقي، في حين تُعزز الخوارزمية الثانية الأمثلة المتشابهة حرفيًا ولكنها تختلف من حيث المنطق، بهدف تحسين التقاط المعلومات المنطقية، وبخاصة العلاقات المنطقية السلبية والعلاقة الشرطية. أجرينا تجارب على مجموعة بيانات ReClor، وأظهرت النتائج أن طريقتنا تحقق أفضل أداء ممكن حاليًا، وأن كلا من إطار توسيع السياق القائم على المنطق وخوارزمية تعزيز البيانات يسهمان في تحسين الدقة. كما أن نظامنا المتكامل الذي يجمع بين عدة نماذج هو أول نظام يتجاوز الأداء البشري على كل من المجموعة السهلة (EASY) والمجموعة الصعبة (HARD) من مجموعة بيانات ReClor.