7 个月前

计算机视觉

计算机视觉

Masaki Saito Eiichi Matsumoto Shunta Saito

摘要

在本文中，我们提出了一种生成模型——时间生成对抗网络（Temporal Generative Adversarial Nets, TGAN），该模型能够学习未标记视频的语义表示，并且具备生成视频的能力。与现有的基于生成对抗网络（Generative Adversarial Nets, GAN）的方法不同，这些方法通常使用一个包含3D反卷积层的单一生成器来生成视频，我们的模型采用了两种不同类型的生成器：时间生成器和图像生成器。时间生成器以单个潜在变量作为输入，输出一组潜在变量，每个潜在变量对应视频中的一个图像帧。图像生成器则将这样的一组潜在变量转换为视频。为了应对在训练具有如此先进网络的GAN时出现的不稳定性问题，我们采用了最近提出的Wasserstein GAN模型，并提出了一种新的方法，以端到端的方式稳定地训练该模型。实验结果证明了我们方法的有效性。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

7 个月前

计算机视觉

计算机视觉

Masaki Saito Eiichi Matsumoto Shunta Saito

摘要

在本文中，我们提出了一种生成模型——时间生成对抗网络（Temporal Generative Adversarial Nets, TGAN），该模型能够学习未标记视频的语义表示，并且具备生成视频的能力。与现有的基于生成对抗网络（Generative Adversarial Nets, GAN）的方法不同，这些方法通常使用一个包含3D反卷积层的单一生成器来生成视频，我们的模型采用了两种不同类型的生成器：时间生成器和图像生成器。时间生成器以单个潜在变量作为输入，输出一组潜在变量，每个潜在变量对应视频中的一个图像帧。图像生成器则将这样的一组潜在变量转换为视频。为了应对在训练具有如此先进网络的GAN时出现的不稳定性问题，我们采用了最近提出的Wasserstein GAN模型，并提出了一种新的方法，以端到端的方式稳定地训练该模型。实验结果证明了我们方法的有效性。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供