HyperAI초신경

Common Sense Reasoning On Swag

평가 지표

Test

평가 결과

이 벤치마크에서 각 모델의 성능 결과

비교 표
모델 이름Test
roberta-a-robustly-optimized-bert-pretraining89.9
swag-a-large-scale-adversarial-dataset-for52.7
swag-a-large-scale-adversarial-dataset-for59.2
bert-pre-training-of-deep-bidirectional86.3
deberta-decoding-enhanced-bert-with90.8