Automated Theorem Proving On Minif2F 1
評価指標
Pass@64
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | Pass@64 |
---|---|
hypertree-proof-search-for-neural-theorem | 32.1 |
hypertree-proof-search-for-neural-theorem | 33.6 |
hypertree-proof-search-for-neural-theorem | 30.6 |
hypertree-proof-search-for-neural-theorem | 42.5 |