منذ 11 أيام
الفعالية غير المعقولة للأساسية: مناقشة خوارزميات الدعم المتجهي في تصنيف النصوص القانونية
Benjamin Clavié, Marc Alphonsus

الملخص
نهدف إلى تسليط الضوء على اتجاه مثير للاهتمام لمساهمة في النقاش الجارِ حول التقدم المحرز في معالجة اللغة الطبيعية القانونية. في الآونة الأخيرة، انتقل تركيز معظم مهام تصنيف النصوص القانونية نحو النماذج العميقة المُدرَّبة مسبقًا الكبيرة، مثل نموذج BERT. في هذه الورقة، نُظهر أن النهج التقليدي أكثر، المبني على تصنيفات آلة الدعم المتجهة (Support Vector Machine)، يحقق أداءً مُذهلًا يُنافس نماذج BERT في مهام التصنيف ضمن معيار LexGLUE. كما نُبرز أن تقليل الأخطاء الناتج عن استخدام نماذج BERT المخصصة مقارنة بالأساسيات (baselines) يكون محدودًا بشكل ملحوظ في المجال القانوني مقارنةً بالمهام اللغوية العامة. ونقدّم ونناقش ثلاث فرضيات كأسباب محتملة لتفسير هذه النتائج، لدعم المناقشات المستقبلية.