1ヶ月前

稀疏訓練、密集生成:高解像度時間GANのメモリ効率的な非教師あり学習

Masaki Saito; Shunta Saito; Masanori Koyama; Sosuke Kobayashi
稀疏訓練、密集生成:高解像度時間GANのメモリ効率的な非教師あり学習
要約

生成対抗ネットワーク(GAN)をビデオデータセットで学習させるのは、データセットの巨大さと各観測値の複雑さのために挑戦的な課題である。一般的に、GANの学習にかかる計算コストは解像度とともに指数関数的に増加する。本研究では、計算コストが解像度とともに線形にしか増加しない高解像度ビデオデータセットの非監督学習における新しいメモリ効率の良い手法を提案する。これにより、ジェネレーターモデルを小さなサブジェネレーターのスタックとして設計し、特定の方法でモデルを学習させることで実現している。学習時には、各サブジェネレーター間にフレームレートを一定の比率で低下させる補助的なダウンサンプリング層を導入する。この手順により、各サブジェネレーターが異なる解像度レベルでのビデオ分布を学習できるようになる。また、非常に複雑なジェネレーターを訓練するためにも少数のGPUしか必要とせず、先駆けた手法よりもインセプションスコアにおいて大幅に優れた性能を発揮する。以上が原文に基づく日本語訳です。専門用語や技術概念については一般的な訳を使用し、文章構造も日本語読者にとって自然な形で調整しました。

稀疏訓練、密集生成:高解像度時間GANのメモリ効率的な非教師あり学習 | 最新論文 | HyperAI超神経