منذ 2 أشهر
الترجمات كسياقات إضافية لتصنيف الجمل
Reinald Kim Amplayo; Kyungjae Lee; Jinyeong Yeo; Seung-won Hwang

الملخص
في مهام تصنيف الجمل، قد تحسن السياقات الإضافية، مثل الجمل المجاورة، دقة المصنف. ومع ذلك، فإن هذه السياقات تعتمد على المجال وبالتالي لا يمكن استخدامها في مهمة تصنيف أخرى ذات مجال غير مناسب. بالمقابل، نقترح استخدام الجمل المترجمة كسياق متاح دائمًا بغض النظر عن المجال. وجدنا أن التوسيع البسيط للسمات من خلال الترجمات يحقق تحسينات طفيفة فقط وقد يقلل من أداء المصنف بسبب الترجمات غير الدقيقة التي تنتج متجهات جمل ضوضائية. لذا، نقدم مجموعة من الوحدات المرتبطة بمتجهات الجمل المتعددة لتصحيح الضوضاء في المتجهات باستخدام المتجهات الأخرى كسياق (MCFA). نوضح أن طريقتنا تؤدي بشكل تنافسي مقارنة بالنماذج السابقة، حيث حققت أفضل أداء في تصنيف البيانات على عدة مجموعات بيانات. نحن أول من يستخدم الترجمات كسياق مستقل عن المجال في تصنيف الجمل.