Natural Language Inference
ベンチマークリスト
このタスクに関連するすべてのベンチマーク
bionli
最高モデル: BioLinkBert
評価指標
詳細を表示
commitmentbank
最高モデル: PaLM 540B (finetuned)
評価指標
詳細を表示
e-snli
最高モデル: ExplainThenPredictAttention (e-InferSent Bi-LSTM + Attention)
評価指標
詳細を表示
farstail
最高モデル: Translate-Source + fastText
評価指標
詳細を表示
hans
最高モデル: Roberta-large
評価指標
詳細を表示
med
最高モデル: NeuralLog
評価指標
詳細を表示
mednli
最高モデル: ClinicalMosaic
評価指標
詳細を表示
mrpc
最高モデル: DeBERTaV3large
評価指標
詳細を表示
multinli
最高モデル: T5-11B
評価指標
詳細を表示
multinli-dev
最高モデル: TinyBERT-6 67M
評価指標
詳細を表示
qnli
最高モデル: ALICE
評価指標
詳細を表示
rte
最高モデル: PaLM 540B (fine-tuned)
評価指標
詳細を表示
scitail
最高モデル: CA-MTL
評価指標
詳細を表示
sick
最高モデル: NeuralLog
評価指標
詳細を表示
snli
最高モデル: EFL (Entailment as Few-shot Learner) + RoBERTa-large
評価指標
詳細を表示
v-snli
最高モデル: MMBT
評価指標
詳細を表示
wnli
最高モデル: DeBERTa
評価指標
詳細を表示
xnli-chinese-dev
最高モデル: ERNIE 2.0 Large
評価指標
詳細を表示
xnli-chinese
最高モデル: ERNIE 2.0 Large
評価指標
詳細を表示
xnli-french
最高モデル: CamemBERT (large)
評価指標
詳細を表示
xwino
最高モデル: mGPT
評価指標
詳細を表示
anli
評価指標
詳細を表示
anli-r3
評価指標
詳細を表示
anli-test
評価指標
詳細を表示
ax
評価指標
詳細を表示
glue
評価指標
詳細を表示
jampatoisnli
評価指標
詳細を表示
kuake-qqr
評価指標
詳細を表示
kuake-qtr
評価指標
詳細を表示
lidirus
評価指標
詳細を表示
mnli-snli-anli-fever
評価指標
詳細を表示
multi-nli
評価指標
詳細を表示
probability-words-nli
評価指標
詳細を表示
quora-question-pairs
評価指標
詳細を表示
rcb
評価指標
詳細を表示
tabfact
評価指標
詳細を表示
terra
評価指標
詳細を表示