Natural Language Inference
벤치마크 목록
해당 작업에 관련된 모든 벤치마크 목록
bionli
최고 모델: BioLinkBert
평가 지표
세부 정보 보기
commitmentbank
최고 모델: PaLM 540B (finetuned)
평가 지표
세부 정보 보기
e-snli
최고 모델: ExplainThenPredictAttention (e-InferSent Bi-LSTM + Attention)
평가 지표
세부 정보 보기
farstail
최고 모델: Translate-Source + fastText
평가 지표
세부 정보 보기
hans
최고 모델: Roberta-large
평가 지표
세부 정보 보기
med
최고 모델: NeuralLog
평가 지표
세부 정보 보기
mednli
최고 모델: ClinicalMosaic
평가 지표
세부 정보 보기
mrpc
최고 모델: DeBERTaV3large
평가 지표
세부 정보 보기
multinli
최고 모델: T5-11B
평가 지표
세부 정보 보기
multinli-dev
최고 모델: TinyBERT-6 67M
평가 지표
세부 정보 보기
qnli
최고 모델: ALICE
평가 지표
세부 정보 보기
rte
최고 모델: PaLM 540B (fine-tuned)
평가 지표
세부 정보 보기
scitail
최고 모델: CA-MTL
평가 지표
세부 정보 보기
sick
최고 모델: NeuralLog
평가 지표
세부 정보 보기
snli
최고 모델: EFL (Entailment as Few-shot Learner) + RoBERTa-large
평가 지표
세부 정보 보기
v-snli
최고 모델: MMBT
평가 지표
세부 정보 보기
wnli
최고 모델: DeBERTa
평가 지표
세부 정보 보기
xnli-chinese-dev
최고 모델: ERNIE 2.0 Large
평가 지표
세부 정보 보기
xnli-chinese
최고 모델: ERNIE 2.0 Large
평가 지표
세부 정보 보기
xnli-french
최고 모델: CamemBERT (large)
평가 지표
세부 정보 보기
xwino
최고 모델: mGPT
평가 지표
세부 정보 보기
anli
평가 지표
세부 정보 보기
anli-r3
평가 지표
세부 정보 보기
anli-test
평가 지표
세부 정보 보기
ax
평가 지표
세부 정보 보기
glue
평가 지표
세부 정보 보기
jampatoisnli
평가 지표
세부 정보 보기
kuake-qqr
평가 지표
세부 정보 보기
kuake-qtr
평가 지표
세부 정보 보기
lidirus
평가 지표
세부 정보 보기
mnli-snli-anli-fever
평가 지표
세부 정보 보기
multi-nli
평가 지표
세부 정보 보기
probability-words-nli
평가 지표
세부 정보 보기
quora-question-pairs
평가 지표
세부 정보 보기
rcb
평가 지표
세부 정보 보기
tabfact
평가 지표
세부 정보 보기
terra
평가 지표
세부 정보 보기