HyperAIHyperAI
منذ 2 أشهر

SemBleu: مقياس قوي لتقييم تحليل AMR

Linfeng Song; Daniel Gildea
SemBleu: مقياس قوي لتقييم تحليل AMR
الملخص

تقييم دقة تحليل AMR ينطوي على مقارنة أزواج من رسومات AMR. المقياس التقييمي الرئيسي، SMATCH (Cai و Knight، 2013)، يقوم بالبحث عن تطابقات واحد لواحد بين عقدتي AMR باستخدام خوارزمية تسلق التل الجشعة، مما يؤدي إلى أخطاء البحث. نقترح SEMBLEU، وهو مقياس قوي يمتد من BLEU (Papineni et al.، 2002) إلى AMRs. لا يعاني هذا المقياس من أخطاء البحث ويأخذ في الاعتبار التطابقات غير المحلية بالإضافة إلى التطابقات المحلية. SEMBLEU مدفوع بالكامل بالمحتوى ويُعاقب الحالات التي لا تحتفظ فيها إخراجة النظام بأغلب المعلومات الواردة من الإدخال. تجارب أولية على مستويات الجملة والمجموعة النصية تظهر أن SEMBLEU يتمتع بتوافق أعلى قليلاً مع الأحكام البشرية مقارنة بـ SMATCH. رمزنا البرمجي متاح على http://github.com/freesunshine0316/sembleu.

SemBleu: مقياس قوي لتقييم تحليل AMR | أحدث الأوراق البحثية | HyperAI