7 个月前

摘要

在本文中，我们展示了如何在存在大量潜在前提知识库的情况下进行自动定理证明，而无需从人类证明中学习。我们提出了一种探索机制，该机制在深度强化学习场景中通过基于tf-idf（词频-逆文档频率）的查找来混合选择额外的前提。这有助于探索和学习哪些前提是证明新定理所必需的。实验结果表明，采用这种探索机制训练的定理证明器优于仅基于人类证明训练的证明器，其性能接近于结合模仿学习和强化学习训练的证明器。我们进行了多次实验，以了解使我们的探索方法有效的基本假设的重要性，从而解释了我们的设计选择。

源 PDF

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

7 个月前

Kshitij Bansal Christian Szegedy Markus N. Rabe Sarah M. Loos Viktor Toman

摘要

在本文中，我们展示了如何在存在大量潜在前提知识库的情况下进行自动定理证明，而无需从人类证明中学习。我们提出了一种探索机制，该机制在深度强化学习场景中通过基于tf-idf（词频-逆文档频率）的查找来混合选择额外的前提。这有助于探索和学习哪些前提是证明新定理所必需的。实验结果表明，采用这种探索机制训练的定理证明器优于仅基于人类证明训练的证明器，其性能接近于结合模仿学习和强化学习训练的证明器。我们进行了多次实验，以了解使我们的探索方法有效的基本假设的重要性，从而解释了我们的设计选择。

源 PDF

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

在大规模理论中无模仿地学习推理 | 论文 | HyperAI超神经

Command Palette

在大规模理论中无模仿地学习推理

Kshitij Bansal Christian Szegedy Markus N. Rabe Sarah M. Loos Viktor Toman

摘要

用 AI 构建 AI

HyperAI Newsletters

Command Palette

在大规模理论中无模仿地学习推理

Kshitij Bansal Christian Szegedy Markus N. Rabe Sarah M. Loos Viktor Toman

摘要

用 AI 构建 AI

HyperAI Newsletters

Command Palette

在大规模理论中无模仿地学习推理

Kshitij Bansal Christian Szegedy Markus N. Rabe Sarah M. Loos Viktor Toman

摘要

用 AI 构建 AI

HyperAI Newsletters