HyperAI초신경

Common Sense Reasoning On Winogavil

평가 지표

Jaccard Index

평가 결과

이 벤치마크에서 각 모델의 성능 결과

0 of 1 row(s) selected.