HyperAI超神经

Natural Language Inference

基准测试列表

该任务相关的所有基准测试列表

bionli
最佳模型: BioLinkBert

评估指标

查看详情
commitmentbank
最佳模型: PaLM 540B (finetuned)

评估指标

查看详情
e-snli
最佳模型: ExplainThenPredictAttention (e-InferSent Bi-LSTM + Attention)

评估指标

查看详情
farstail
最佳模型: Translate-Source + fastText

评估指标

查看详情
hans
最佳模型: Roberta-large

评估指标

查看详情
med
最佳模型: NeuralLog

评估指标

查看详情
mednli
最佳模型: ClinicalMosaic

评估指标

查看详情
mrpc
最佳模型: DeBERTaV3large

评估指标

查看详情
multinli
最佳模型: T5-11B

评估指标

查看详情
multinli-dev
最佳模型: TinyBERT-6 67M

评估指标

查看详情
qnli
最佳模型: ALICE

评估指标

查看详情
rte
最佳模型: PaLM 540B (fine-tuned)

评估指标

查看详情
scitail
最佳模型: CA-MTL

评估指标

查看详情
sick
最佳模型: NeuralLog

评估指标

查看详情
snli
最佳模型: EFL (Entailment as Few-shot Learner) + RoBERTa-large

评估指标

查看详情
v-snli
最佳模型: MMBT

评估指标

查看详情
wnli
最佳模型: DeBERTa

评估指标

查看详情
xnli-chinese-dev
最佳模型: ERNIE 2.0 Large

评估指标

查看详情
xnli-chinese
最佳模型: ERNIE 2.0 Large

评估指标

查看详情
xnli-french
最佳模型: CamemBERT (large)

评估指标

查看详情
xwino
最佳模型: mGPT

评估指标

查看详情
anli

评估指标

查看详情
anli-r3

评估指标

查看详情
anli-test

评估指标

查看详情
ax

评估指标

查看详情
glue

评估指标

查看详情
jampatoisnli

评估指标

查看详情
kuake-qqr

评估指标

查看详情
kuake-qtr

评估指标

查看详情
lidirus

评估指标

查看详情
mnli-snli-anli-fever

评估指标

查看详情
multi-nli

评估指标

查看详情
probability-words-nli

评估指标

查看详情
quora-question-pairs

评估指标

查看详情
rcb

评估指标

查看详情
tabfact

评估指标

查看详情
terra

评估指标

查看详情