HyperAI超神経

Automated Theorem Proving On Coqgym

評価指標

Percentage correct

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Percentage correct
learning-to-prove-theorems-via-interacting12.2