HyperAI超神経

Natural Language Inference

ベンチマークリスト

このタスクに関連するすべてのベンチマーク

bionli
最高モデル: BioLinkBert

評価指標

詳細を表示
commitmentbank
最高モデル: PaLM 540B (finetuned)

評価指標

詳細を表示
e-snli
最高モデル: ExplainThenPredictAttention (e-InferSent Bi-LSTM + Attention)

評価指標

詳細を表示
farstail
最高モデル: Translate-Source + fastText

評価指標

詳細を表示
hans
最高モデル: Roberta-large

評価指標

詳細を表示
med
最高モデル: NeuralLog

評価指標

詳細を表示
mednli
最高モデル: ClinicalMosaic

評価指標

詳細を表示
mrpc
最高モデル: DeBERTaV3large

評価指標

詳細を表示
multinli
最高モデル: T5-11B

評価指標

詳細を表示
multinli-dev
最高モデル: TinyBERT-6 67M

評価指標

詳細を表示
qnli
最高モデル: ALICE

評価指標

詳細を表示
rte
最高モデル: PaLM 540B (fine-tuned)

評価指標

詳細を表示
scitail
最高モデル: CA-MTL

評価指標

詳細を表示
sick
最高モデル: NeuralLog

評価指標

詳細を表示
snli
最高モデル: EFL (Entailment as Few-shot Learner) + RoBERTa-large

評価指標

詳細を表示
v-snli
最高モデル: MMBT

評価指標

詳細を表示
wnli
最高モデル: DeBERTa

評価指標

詳細を表示
xnli-chinese-dev
最高モデル: ERNIE 2.0 Large

評価指標

詳細を表示
xnli-chinese
最高モデル: ERNIE 2.0 Large

評価指標

詳細を表示
xnli-french
最高モデル: CamemBERT (large)

評価指標

詳細を表示
xwino
最高モデル: mGPT

評価指標

詳細を表示
anli

評価指標

詳細を表示
anli-r3

評価指標

詳細を表示
anli-test

評価指標

詳細を表示
ax

評価指標

詳細を表示
glue

評価指標

詳細を表示
jampatoisnli

評価指標

詳細を表示
kuake-qqr

評価指標

詳細を表示
kuake-qtr

評価指標

詳細を表示
lidirus

評価指標

詳細を表示
mnli-snli-anli-fever

評価指標

詳細を表示
multi-nli

評価指標

詳細を表示
probability-words-nli

評価指標

詳細を表示
quora-question-pairs

評価指標

詳細を表示
rcb

評価指標

詳細を表示
tabfact

評価指標

詳細を表示
terra

評価指標

詳細を表示