HyperAI超神経

Automated Theorem Proving On Holist Benchmark

評価指標

Percentage correct

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Percentage correct
holist-an-environment-for-machine-learning-of32.65
learning-to-reason-in-large-theories-without36.55
holist-an-environment-for-machine-learning-of38.88
graph-representations-for-higher-order-logic49.95