7 个月前

计算机视觉

计算机视觉

Ashesh Jain Amir R. Zamir Silvio Savarese Ashutosh Saxena

摘要

深度递归神经网络（Deep Recurrent Neural Network）架构虽然在建模序列方面表现出色，但缺乏直观的高层次时空结构。许多计算机视觉问题本质上具有底层的高层次结构，可以从这种结构中受益。时空图（Spatio-temporal graphs）是一种流行的工具，用于在现实世界问题的表述中引入这样的高层次直觉。本文提出了一种方法，将高层次时空图的强大能力与递归神经网络（Recurrent Neural Networks, RNNs）在序列学习中的成功结合起来。我们开发了一种可扩展的方法，将任意时空图转化为一种丰富的RNN混合模型，该模型前馈、完全可微且联合训练。所提出的方法是通用且有原则性的，因为它可以通过采用一组明确定义的步骤来转换任何时空图。我们在一系列问题上对所提出的方法进行了评估，这些问题从建模人类运动到物体交互不等，结果显示其性能显著优于现有最佳方法。我们期望这种方法能够通过高层次时空图和递归神经网络为问题表述提供新的途径。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

7 个月前

计算机视觉

计算机视觉

Ashesh Jain Amir R. Zamir Silvio Savarese Ashutosh Saxena

摘要

深度递归神经网络（Deep Recurrent Neural Network）架构虽然在建模序列方面表现出色，但缺乏直观的高层次时空结构。许多计算机视觉问题本质上具有底层的高层次结构，可以从这种结构中受益。时空图（Spatio-temporal graphs）是一种流行的工具，用于在现实世界问题的表述中引入这样的高层次直觉。本文提出了一种方法，将高层次时空图的强大能力与递归神经网络（Recurrent Neural Networks, RNNs）在序列学习中的成功结合起来。我们开发了一种可扩展的方法，将任意时空图转化为一种丰富的RNN混合模型，该模型前馈、完全可微且联合训练。所提出的方法是通用且有原则性的，因为它可以通过采用一组明确定义的步骤来转换任何时空图。我们在一系列问题上对所提出的方法进行了评估，这些问题从建模人类运动到物体交互不等，结果显示其性能显著优于现有最佳方法。我们期望这种方法能够通过高层次时空图和递归神经网络为问题表述提供新的途径。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供