Dialogue Generation On Reddit Multi Ref
評価指標
interest (human)
relevance (human)
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | interest (human) | relevance (human) |
---|---|---|
jointly-optimizing-diversity-and-relevance-in | 2.53 | 2.72 |
このベンチマークにおける各モデルのパフォーマンス結果
モデル名 | interest (human) | relevance (human) |
---|---|---|
jointly-optimizing-diversity-and-relevance-in | 2.53 | 2.72 |