Dialogue Generation On Reddit Multi Ref
Metriken
interest (human)
relevance (human)
Ergebnisse
Leistungsergebnisse verschiedener Modelle zu diesem Benchmark
Vergleichstabelle
Modellname | interest (human) | relevance (human) |
---|---|---|
jointly-optimizing-diversity-and-relevance-in | 2.53 | 2.72 |