Long Context Understanding On Longbench
評価指標
Average Score
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | Average Score |
---|---|
a-training-free-length-extrapolation-approach | 45.17 |
a-training-free-length-extrapolation-approach | 46.22 |
a-training-free-length-extrapolation-approach | 45.38 |