التحصيل التجميعي الأقصى بايز سماش لتحليل AMR

شهد تحليل AMR زيادة غير مسبوقة في الأداء خلال السنوات الثلاث الماضية، وذلك بفضل مزيج من العوامل التي تشمل تحسينات في البنية المعمارية والتعلم المنقول. كما ساهمت تقنيات التعلم الذاتي في دفع حدود الأداء إلى الأمام. ومع ذلك، يبدو أن تأثير التعلم الذاتي وتعزيز البيانات ذات الجودة المُعادلة (silver data augmentation) قد بدأ في التراجع بالنسبة لأغلب المحولات عالية الأداء الحديثة. في هذا البحث، نقترح التغلب على هذه الظاهرة التي تُظهر عائدات متناقصة من البيانات المُعادلة من خلال دمج تقنيات التجميع القائمة على مقياس Smatch مع تقنية تجميع التبادل (ensemble distillation). وباستخدام تجربة تجريبية شاملة، تمكنا من تحقيق أداء قياسي جديد لمحول واحد باللغة الإنجليزية، بتحقيق 85.9 (AMR2.0) و84.3 (AMR3.0)، كما عادت الفوائد من تعزيز البيانات المُعادلة لتكون ملموسة مرة أخرى. كما تم تحقيق أداء قياسي جديد في تحليل AMR متعدد اللغات للصينية، والألمانية، والإيطالية، والإسبانية. وأخيرًا، استعرضنا تأثير التقنية المقترحة على التكيّف بين المجالات، وبيّنا أنها قادرة على تحقيق مكاسب تُنافس تلك الناتجة عن البيانات المُعلّمة يدويًا، خصوصًا في مجموعة بيانات QALD-9، كما تم تحقيق أداء قياسي جديد في تحليل BioAMR.