HyperAI

Tutoriel En Ligne : Innovation Du Système D'ia Physique, Démarrage Rapide Du Modèle De Base Mondial NVIDIA, Capable De Simuler La Lumière Du Soleil Et La Brume

特色图像

Lors de la conférence CES 2025 début janvier, Huang Renxun a apporté de multiples surprises à tout le monde dans une nouvelle veste en cuir. En plus du « GPU RTX 5090 le plus rapide au monde », le modèle de base mondial Cosmos a également attiré une large attention.

« La prochaine frontière de l’IA est la physique. » Huang a utilisé Cosmos pour expliquer intuitivement l’origine et la crédibilité de cette analyse de tendance.

Comme son nom l’indique, un modèle mondial est capable de générer et de simuler un monde virtuel, simulant ainsi les relations spatiales des objets de la scène et leurs interactions physiques. Spécifiquement,Le modèle de base du monde Cosmos est un ensemble de modèles de diffusion et de transformateur autorégressifs ouverts pour la génération de vidéos sensibles à la physique.9 000 milliards de jetons formés sur 20 millions d'heures d'interactions humaines réelles, d'environnements, de données industrielles, robotiques et de conduite.

Jim Fan, scientifique senior chez Nvidia, a donné un résumé précis de Cosmos sur son compte social :

* Deux modes sont disponibles :modèles de diffusion (marqueurs continus) et modèles autorégressifs (marqueurs discrets) ;

* Prend en charge deux méthodes de génération :

Texte en vidéo (texte->vidéo) et texte + vidéo en vidéo (texte+vidéo->vidéo)

Afin de permettre à chacun de découvrir ce modèle de base mondial innovant, la section tutoriel du site officiel d'HyperAI a lancé « Déploiement en un clic du modèle de base mondial Cosmos ». Les amis intéressés peuvent venir l'essayer eux-mêmes ~

Adresse du tutoriel :

https://go.hyper.ai/GTCAL

Essai de démonstration

1. Connectez-vous à hyper.ai, sur la page du didacticiel, sélectionnez Déployer le modèle de base Cosmos World en un clic, puis cliquez sur Exécuter ce didacticiel en ligne.

2. Une fois la page affichée, cliquez sur « Cloner » dans le coin supérieur droit pour cloner le didacticiel dans votre propre conteneur.

3. Sélectionnez la puissance de calcul « NVIDIA RTX A6000 » et l'image « PyTorch ». Vous pouvez choisir « Payer au fur et à mesure » ou « Forfait journalier/hebdomadaire/mensuel » selon vos besoins, puis cliquer sur « Continuer ».

Les nouveaux utilisateurs peuvent s'inscrire en utilisant le lien d'invitation ci-dessous pour obtenir 4 heures de RTX 4090 + 5 heures de temps CPU gratuit !

Lien d'invitation exclusif HyperAI (copier et ouvrir dans le navigateur) :

https://openbayes.com/console/signup?r=Ada0322_QZy7

De plus, l'événement du Nouvel An d'OpenBayes est en cours et les packages RTX 4090 et RTX A6000 à carte unique sont à moitié prix pour la journée et la semaine !

4. Attendez que les ressources soient allouées. Le premier processus de clonage prend environ 7 minutes. Lorsque le statut passe à « En cours d'exécution », cliquez sur « Ouvrir l'espace de travail » et ouvrez « Terminal ».

5. Entrez la commande suivante pour activer l'environnement :

conda activate ./cosmos

6. Entrez la commande suivante pour passer au répertoire Cosmos :

cd Cosmos

7. Entrez la commande suivante pour démarrer l'interface du modèle gradio :

PYTHONPATH=$(pwd) python cosmos1/models/diffusion/inference/gradio_text2world.py --checkpoint_dir checkpoints --diffusion_transformer_dir Cosmos-1.0-Diffusion-7B-Text2World --offload_prompt_upsampler --offload_text_encoder_model --offload_guardrail_models --video_save_name Cosmos-1.0-Diffusion-7B-Text2World --checkpoint_dir /input0

Une fois le port 8080 affiché, ouvrez l'adresse API à droite pour accéder à l'interface gradio.

Affichage des effets

1. Après être entré dans l'interface gradio, entrez le mot d'invite dans « Entrez votre invite » et cliquez sur « Soumettre » pour démarrer l'inférence. Vous pouvez voir la vidéo générée après avoir attendu quelques minutes.

J'ai créé une vidéo d'une scène naturelle, et l'invite est ci-dessous pour votre référence.

invite : Un matin, le soleil brillait à travers les nuages dans les montagnes, illuminant le lac tranquille. Le lac est clair et entouré de forêts verdoyantes. Les montagnes au loin sont enveloppées de brume, quelques oiseaux volent dans le ciel, l'air est frais, calme et paisible.

Nous avons créé un « Groupe d'échange de tutoriels de diffusion stable ». Bienvenue aux amis pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats des applications~

Scannez le code QR ci-dessous pour ajouter HyperaiXingXing sur WeChat (ID WeChat : Hyperai01) et notez « SD Tutorial Exchange Group » pour rejoindre le chat de groupe.