Semantic Textual Similarity
ベンチマークリスト
このタスクに関連するすべてのベンチマーク
cxc
最高モデル: PromCSE-RoBERTa-large (0.355B)
評価指標
詳細を表示
mrpc
最高モデル: BERT-Base
評価指標
詳細を表示
mrpc-dev
最高モデル: Synthesizer (R+V)
評価指標
詳細を表示
mteb
最高モデル: AnglE-UAE
評価指標
詳細を表示
senteval
最高モデル: XLNet-Large
評価指標
詳細を表示
sick
最高モデル: SRoBERTa-NLI-large
評価指標
詳細を表示
sts-benchmark
最高モデル: DeBERTa (large)
評価指標
詳細を表示
sts12
最高モデル: PromptEOL+CSE+OPT-13B
評価指標
詳細を表示
sts13
最高モデル: PromCSE-RoBERTa-large (0.355B)
評価指標
詳細を表示
sts14
最高モデル: PromCSE-RoBERTa-large (0.355B)
評価指標
詳細を表示
sts15
最高モデル: PromptEOL+CSE+LLaMA-30B
評価指標
詳細を表示
sts16
最高モデル: AnglE-LLaMA-13B
評価指標
詳細を表示
sick-r
評価指標
詳細を表示