7 个月前

自然语言处理

Joseph Suarez Justin Johnson Li Fei-Fei

摘要

我们提出了一种新颖的动态可微推理（Dynamic Differentiable Reasoning, DDR）框架，用于联合学习分支程序及其组成函数；这解决了近期动态架构中显著的非可微性问题。我们将该框架应用于两个高度紧凑且数据高效架构中的两种设置：用于CLEVR视觉问答的DDRprog和用于逆波兰表示法表达式求值的DDRstack。DDRprog利用循环控制器共同预测并执行与底层问题逻辑直接对应的模块化神经程序；它显式地分叉子进程以处理逻辑分支。通过有效利用额外的结构监督，我们在子任务一致性方面取得了显著改进，并在整体准确性上略有提升。此外，我们在RPN设置中进一步展示了结构监督的优势：在DDRstack中引入堆栈假设使我们的方法能够泛化到长表达式，而LSTM在这种情况下无法完成任务。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

7 个月前

自然语言处理

Joseph Suarez Justin Johnson Li Fei-Fei

摘要

我们提出了一种新颖的动态可微推理（Dynamic Differentiable Reasoning, DDR）框架，用于联合学习分支程序及其组成函数；这解决了近期动态架构中显著的非可微性问题。我们将该框架应用于两个高度紧凑且数据高效架构中的两种设置：用于CLEVR视觉问答的DDRprog和用于逆波兰表示法表达式求值的DDRstack。DDRprog利用循环控制器共同预测并执行与底层问题逻辑直接对应的模块化神经程序；它显式地分叉子进程以处理逻辑分支。通过有效利用额外的结构监督，我们在子任务一致性方面取得了显著改进，并在整体准确性上略有提升。此外，我们在RPN设置中进一步展示了结构监督的优势：在DDRstack中引入堆栈假设使我们的方法能够泛化到长表达式，而LSTM在这种情况下无法完成任务。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供