7 个月前

计算机视觉

Jack W Rae Chris Dyer Peter Dayan Timothy P Lillicrap

摘要

使用反向传播训练的神经网络通常难以识别那些仅被观察到少数几次的类别。在大多数类别标签都较为罕见的应用中，如语言模型，这可能成为性能瓶颈。一种潜在的解决方案是通过添加一个快速学习的非参数模型来增强网络，该模型将最近的激活状态和类别标签存储到外部记忆中。我们探索了一种简化的架构，其中我们将模型的一部分参数视为快速记忆存储单元。这有助于在网络中保留更长时间的信息，而无需额外的空间或计算资源。在图像分类任务中，我们在Omniglot图像课程任务上展示了对新类别的更快绑定能力。此外，我们在基于词的语言模型上也取得了改进的性能，这些模型应用于新闻报道（GigaWord）、书籍（Project Gutenberg）和维基百科文章（WikiText-103），后者达到了29.2的最新最佳困惑度。注释：- 反向传播（backpropagation）- 非参数模型（non-parametric model）- 困惑度（perplexity）

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

7 个月前

计算机视觉

Jack W Rae Chris Dyer Peter Dayan Timothy P Lillicrap

摘要

使用反向传播训练的神经网络通常难以识别那些仅被观察到少数几次的类别。在大多数类别标签都较为罕见的应用中，如语言模型，这可能成为性能瓶颈。一种潜在的解决方案是通过添加一个快速学习的非参数模型来增强网络，该模型将最近的激活状态和类别标签存储到外部记忆中。我们探索了一种简化的架构，其中我们将模型的一部分参数视为快速记忆存储单元。这有助于在网络中保留更长时间的信息，而无需额外的空间或计算资源。在图像分类任务中，我们在Omniglot图像课程任务上展示了对新类别的更快绑定能力。此外，我们在基于词的语言模型上也取得了改进的性能，这些模型应用于新闻报道（GigaWord）、书籍（Project Gutenberg）和维基百科文章（WikiText-103），后者达到了29.2的最新最佳困惑度。注释：- 反向传播（backpropagation）- 非参数模型（non-parametric model）- 困惑度（perplexity）

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供