Dialogue Rewriting On Multi Rewrite
評価指標
Rewriting F2
Rewriting F3
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | Rewriting F2 | Rewriting F3 |
---|---|---|
sarg-a-novel-semi-autoregressive-generator | 52.5 | 46.4 |
sarg-a-novel-semi-autoregressive-generator | - | - |
incomplete-utterance-rewriting-as-semantic | - | 47.7 |