6ヶ月前

拡散モデル

アプローチ／フレームワーク

マルチモーダル

コンピュータビジョン

William Harvey Saeid Naderiparizi Vaden Masrani Christian Weilbach Frank Wood

概要

本稿では、ノイズ除去拡散確率モデル（denoising diffusion probabilistic models）に基づく動画モデリングのフレームワークを提示し、多様な現実的な環境下で長時間にわたる動画の補完を実現する。我々は、テスト時に任意の動画フレームのサブセットを、他の任意のサブセットを条件としてサンプリング可能な生成モデルを導入し、その目的に適したアーキテクチャを提案する。このアプローチにより、長時間動画におけるフレームのサンプリング順序に関する多様なスケジュールを効率的に比較・最適化でき、既にサンプリングされたフレームに対する選択的かつ疎な、また長距離の条件付けを実現できる。我々は複数のデータセットにおいて従来手法を上回る動画モデリング性能を実証し、長さ25分を超える時間的に整合性のある動画を生成することに成功した。さらに、CARLA自律走行シミュレータで生成された動画に基づく意味のあるセマンティックメトリクスを用いた新しい動画モデリングデータセットも公開する。

ソースPDF コードを表示

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

6ヶ月前

拡散モデル

アプローチ／フレームワーク

マルチモーダル

コンピュータビジョン

William Harvey Saeid Naderiparizi Vaden Masrani Christian Weilbach Frank Wood

概要

本稿では、ノイズ除去拡散確率モデル（denoising diffusion probabilistic models）に基づく動画モデリングのフレームワークを提示し、多様な現実的な環境下で長時間にわたる動画の補完を実現する。我々は、テスト時に任意の動画フレームのサブセットを、他の任意のサブセットを条件としてサンプリング可能な生成モデルを導入し、その目的に適したアーキテクチャを提案する。このアプローチにより、長時間動画におけるフレームのサンプリング順序に関する多様なスケジュールを効率的に比較・最適化でき、既にサンプリングされたフレームに対する選択的かつ疎な、また長距離の条件付けを実現できる。我々は複数のデータセットにおいて従来手法を上回る動画モデリング性能を実証し、長さ25分を超える時間的に整合性のある動画を生成することに成功した。さらに、CARLA自律走行シミュレータで生成された動画に基づく意味のあるセマンティックメトリクスを用いた新しい動画モデリングデータセットも公開する。

ソースPDF コードを表示

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています