HyperAI

Coherence Evaluation On Gcdc Rst F1

Metriken

Average F1

Ergebnisse

Leistungsergebnisse verschiedener Modelle zu diesem Benchmark

Vergleichstabelle
ModellnameAverage F1
discourse-coherence-in-the-wild-a-dataset46.65
neural-rst-based-evaluation-of-discourse46.98
neural-rst-based-evaluation-of-discourse44.30