8ヶ月前

拡散モデル

画像間変換

アプローチ／フレームワーク

マルチモーダル

Yuan Liu Cheng Lin Zijiao Zeng Xiaoxiao Long Lingjie Liu Taku Komura Wenping Wang

概要

本論文では、単一視点画像からマルチビューの一貫性のある画像を生成する新しい拡散モデルであるSyncDreamerについて紹介します。最近の研究Zero123では、事前学習された大規模2D拡散モデルを使用して、物体の単一視点画像から合理的な新規視点を生成する能力を示しています。しかし、生成された画像の幾何学的形状と色の一貫性を維持することは依然として課題となっています。この問題に対処するために、我々はマルチビューの同時確率分布をモデル化し、単一の逆プロセスでマルチビューの一貫性のある画像を生成できる同期マルチビュー拡散モデルを提案します。SyncDreamerは、3D認識特徴注意機構（3D-aware feature attention mechanism）を通じて、異なる視点間での対応する特徴量を関連付けながら、逆プロセスの各ステップで生成されるすべての画像の中間状態を同期させます。実験結果は、SyncDreamerが異なる視点間で高い一貫性を持つ画像を生成できることを示しており、新規視点合成やテキストから3Dへの変換（text-to-3D）、画像から3Dへの変換（image-to-3D）などの様々な3D生成タスクに適していることを示唆しています。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

8ヶ月前

拡散モデル

画像間変換

アプローチ／フレームワーク

マルチモーダル

Yuan Liu Cheng Lin Zijiao Zeng Xiaoxiao Long Lingjie Liu Taku Komura Wenping Wang

概要

本論文では、単一視点画像からマルチビューの一貫性のある画像を生成する新しい拡散モデルであるSyncDreamerについて紹介します。最近の研究Zero123では、事前学習された大規模2D拡散モデルを使用して、物体の単一視点画像から合理的な新規視点を生成する能力を示しています。しかし、生成された画像の幾何学的形状と色の一貫性を維持することは依然として課題となっています。この問題に対処するために、我々はマルチビューの同時確率分布をモデル化し、単一の逆プロセスでマルチビューの一貫性のある画像を生成できる同期マルチビュー拡散モデルを提案します。SyncDreamerは、3D認識特徴注意機構（3D-aware feature attention mechanism）を通じて、異なる視点間での対応する特徴量を関連付けながら、逆プロセスの各ステップで生成されるすべての画像の中間状態を同期させます。実験結果は、SyncDreamerが異なる視点間で高い一貫性を持つ画像を生成できることを示しており、新規視点合成やテキストから3Dへの変換（text-to-3D）、画像から3Dへの変換（image-to-3D）などの様々な3D生成タスクに適していることを示唆しています。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

SyncDreamer: 単一視点画像から多視点一貫性のある画像を生成する | 記事 | HyperAI超神経