SeqVAT: التدريب العدواني الافتراضي للتصنيف التسلسلي شبه المراقب

يُعد التدريب العدواني الافتراضي (VAT) تقنية قوية لتحسين مقاومة النموذج في البيئات المراقبة وغير المراقبة. وهو فعّال ويمكن تطبيقه بسهولة على العديد من مهام تصنيف الصور وتصنيف النصوص. ومع ذلك، لم تُظهر فوائده على مهام التسمية التسلسلية مثل التعرف على الكيانات الاسمية (NER) بشكل ملحوظ، وذلك أساسًا لأن النهج السابق لم يستطع دمج VAT مع الحقل العشوائي الشرطي (CRF). إذ يُعزز CRF الدقة بشكل كبير في نماذج التسلسل من خلال وضع قيود على انتقالات التسميات، مما يجعله عنصرًا أساسيًا في معظم هياكل النماذج المتطورة لتصنيف التسلسلات. في هذه الورقة، نقترح SeqVAT، وهي طريقة تُطبّق VAT بشكل طبيعي على نماذج التسمية التسلسلية التي تحتوي على CRF. تُظهر الدراسات التجريبية أن SeqVAT لا تُحسّن بشكل ملحوظ أداء التسمية التسلسلية مقارنة بالأساليب الأساسية في البيئات المراقبة، بل تتفوّق أيضًا على أحدث الأساليب في البيئات غير المراقبة.