HyperAI超神经

Logical Reasoning On Lingoly

评估指标

Delta_NoContext
Exact Match Accuracy

评测结果

各个模型在此基准测试上的表现结果