HyperAI초신경

Natural Language Inference

벤치마크 목록

해당 작업에 관련된 모든 벤치마크 목록

bionli
최고 모델: BioLinkBert

평가 지표

세부 정보 보기
commitmentbank
최고 모델: PaLM 540B (finetuned)

평가 지표

세부 정보 보기
e-snli
최고 모델: ExplainThenPredictAttention (e-InferSent Bi-LSTM + Attention)

평가 지표

세부 정보 보기
farstail
최고 모델: Translate-Source + fastText

평가 지표

세부 정보 보기
hans
최고 모델: Roberta-large

평가 지표

세부 정보 보기
med
최고 모델: NeuralLog

평가 지표

세부 정보 보기
mednli
최고 모델: ClinicalMosaic

평가 지표

세부 정보 보기
mrpc
최고 모델: DeBERTaV3large

평가 지표

세부 정보 보기
multinli
최고 모델: T5-11B

평가 지표

세부 정보 보기
multinli-dev
최고 모델: TinyBERT-6 67M

평가 지표

세부 정보 보기
qnli
최고 모델: ALICE

평가 지표

세부 정보 보기
rte
최고 모델: PaLM 540B (fine-tuned)

평가 지표

세부 정보 보기
scitail
최고 모델: CA-MTL

평가 지표

세부 정보 보기
sick
최고 모델: NeuralLog

평가 지표

세부 정보 보기
snli
최고 모델: EFL (Entailment as Few-shot Learner) + RoBERTa-large

평가 지표

세부 정보 보기
v-snli
최고 모델: MMBT

평가 지표

세부 정보 보기
wnli
최고 모델: DeBERTa

평가 지표

세부 정보 보기
xnli-chinese-dev
최고 모델: ERNIE 2.0 Large

평가 지표

세부 정보 보기
xnli-chinese
최고 모델: ERNIE 2.0 Large

평가 지표

세부 정보 보기
xnli-french
최고 모델: CamemBERT (large)

평가 지표

세부 정보 보기
xwino
최고 모델: mGPT

평가 지표

세부 정보 보기
anli

평가 지표

세부 정보 보기
anli-r3

평가 지표

세부 정보 보기
anli-test

평가 지표

세부 정보 보기
ax

평가 지표

세부 정보 보기
glue

평가 지표

세부 정보 보기
jampatoisnli

평가 지표

세부 정보 보기
kuake-qqr

평가 지표

세부 정보 보기
kuake-qtr

평가 지표

세부 정보 보기
lidirus

평가 지표

세부 정보 보기
mnli-snli-anli-fever

평가 지표

세부 정보 보기
multi-nli

평가 지표

세부 정보 보기
probability-words-nli

평가 지표

세부 정보 보기
quora-question-pairs

평가 지표

세부 정보 보기
rcb

평가 지표

세부 정보 보기
tabfact

평가 지표

세부 정보 보기
terra

평가 지표

세부 정보 보기