Explanation Generation On E Snli Ve
評価指標
Human Explanation Rating
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | Human Explanation Rating |
---|---|
harnessing-the-power-of-multi-task | 85.7 |
harnessing-the-power-of-multi-task | 80.4 |
このベンチマークにおける各モデルのパフォーマンス結果
モデル名 | Human Explanation Rating |
---|---|
harnessing-the-power-of-multi-task | 85.7 |
harnessing-the-power-of-multi-task | 80.4 |