1. Introduction au tutoriel

Les ressources informatiques utilisées dans ce tutoriel sont une seule carte RTX 4090.

Stable Virtual Camera (Seva) est un modèle de diffusion général lancé par Stability AI en mars 2025. Les résultats de l'article associé sont «Caméra virtuelle stable : synthèse de vues génératives avec modèles de diffusion"

Seva est capable de générer de nouvelles vues d'une scène à partir d'un nombre quelconque de vues d'entrée et de caméras cibles. Sa conception surmonte les limites des méthodes existantes dans la génération d'échantillons avec de grandes variations de points de vue ou d'échantillons temporellement lisses, sans s'appuyer sur une configuration de tâche spécifique. Une caractéristique notable de ce modèle est qu’il peut maintenir une génération d’échantillons très cohérente sans nécessiter d’apprentissage supplémentaire de représentation 3D, simplifiant ainsi le processus de synthèse de perspective dans les applications pratiques. De plus, Seva peut générer des vidéos de haute qualité d'une durée maximale d'une demi-minute et les diffuser en boucle de manière transparente. Des tests de référence approfondis montrent que Seva surpasse les méthodes existantes sur différents ensembles de données et paramètres.

2. Étapes de l'opération

1. Démarrez le conteneur

Après avoir démarré le conteneur, cliquez sur l’adresse API pour accéder à l’interface Web. En raison du grand modèle, il faut environ 3 minutes pour afficher l'interface WebUI, sinon elle affichera « Bad Gateway »

2. Fonctions de base

Cliquez sur l'interface « Basique »

Cette fonction d'interface peut générer une vidéo basée sur l'une des trajectoires de caméra prédéfinies à partir d'une seule image.

3. Avancé

Cliquez sur l'interface « Basique »

Cette interface vous permet de générer une vidéo de n'importe quelle trajectoire de caméra de votre choix à partir d'un nombre quelconque d'images d'entrée via une interface basée sur des images clés.

Après avoir téléchargé l'image, cliquez sur Confirmer

Cliquez sur Traiter l’image et attendez que l’image soit traitée.

Cliquez sur Ajouter une image clé pour ajouter une image clé.

Cliquez pour générer la vidéo

3. Discussion

🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓

La Caméra Virtuelle Stable Transforme Les Images En Vidéos 3D En Quelques Secondes

1. Introduction au tutoriel

2. Étapes de l'opération

1. Démarrez le conteneur

2. Fonctions de base

Cliquez sur l'interface « Basique »

3. Avancé

Cliquez sur l'interface « Basique »

Après avoir téléchargé l'image, cliquez sur Confirmer

Cliquez sur Traiter l’image et attendez que l’image soit traitée.

Cliquez sur Ajouter une image clé pour ajouter une image clé.

Cliquez pour générer la vidéo

3. Discussion