HyperAIHyperAI

Command Palette

Search for a command to run...

LongCat-Video : Le Modèle De Génération Vidéo IA Open Source De Meituan

Date

il y a 2 mois

Size

10.51 MB

License

MIT

Paper URL

2510.22200

1. Introduction au tutoriel

Construire

LongCat-Video est un modèle de génération vidéo open source basé sur l'IA et doté de 13,6 milliards de paramètres. Développé par l'équipe LongCat de Meituan, il excelle dans des tâches telles que la conversion de texte en vidéo, d'image en vidéo et la continuation de vidéos, notamment pour la génération efficace de vidéos longues de haute qualité. Ce modèle utilise l'optimisation par apprentissage par renforcement multi-récompense (GRPO) et affiche des performances comparables à celles des principaux modèles open source de génération vidéo et des solutions commerciales de pointe, tant dans des benchmarks internes que publics. Des articles de recherche associés sont disponibles. Rapport technique LongCat-Video .

Ce tutoriel utilise une seule carte graphique RTX PRO 6000 pour la puissance de calcul. Quatre exemples sont fournis à titre de test : conversion d’image en vidéo, conversion de texte en vidéo, vidéo longue et lecture de la suite vidéo.

2. Affichage des effets

1. Image en vidéo

2. Conversion de texte en vidéo

3. Génération de vidéos longues

4. Suite de la vidéo

3. Étapes de l'opération

1. Démarrez le conteneur

2. Étapes d'utilisation

Si le message « Bad Gateway » s'affiche, cela signifie que le modèle est en cours d'initialisation. Ce modèle étant volumineux, veuillez patienter 5 à 6 minutes, puis actualiser la page.

1. Image en vidéo

Description des paramètres :

  • Suggestion négative : En saisissant des éléments indésirables, elle guide le modèle afin qu’il évite ces caractéristiques, améliorant ainsi la qualité du contenu généré.
  • Résolution : Spécifie les dimensions en pixels (largeur × hauteur) de l’image générée.
  • Graine : contrôle le point de départ de l’aléatoire dans le processus de génération. Une valeur de graine fixe garantit des résultats reproductibles.

2. Conversion de texte en vidéo

Description des paramètres :

  • Suggestion négative : En saisissant des éléments indésirables, elle guide le modèle afin qu’il évite ces caractéristiques, améliorant ainsi la qualité du contenu généré.
  • Hauteur : Spécifie la hauteur de l’image générée.
  • Largeur : Spécifie la largeur de l’image générée.
  • Graine : contrôle le point de départ de l’aléatoire dans le processus de génération. Une valeur de graine fixe garantit des résultats reproductibles.

3. Génération de vidéos longues

La génération de vidéos longues prend environ 20 minutes.

Description des paramètres :

  • Suggestion négative : En saisissant des éléments indésirables, elle guide le modèle afin qu’il évite ces caractéristiques, améliorant ainsi la qualité du contenu généré.
  • Nombre de segments : Plus il y a de segments, plus la vidéo est longue.
  • Graine : contrôle le point de départ de l’aléatoire dans le processus de génération. Une valeur de graine fixe garantit des résultats reproductibles.

4. Suite de la vidéo

La suite de la vidéo dure environ 20 minutes.

Description des paramètres :

  • Suggestion négative : En saisissant des éléments indésirables, elle guide le modèle afin qu’il évite ces caractéristiques, améliorant ainsi la qualité du contenu généré.
  • Résolution : Spécifie les dimensions en pixels (largeur × hauteur) de l’image générée.
  • Graine : contrôle le point de départ de l’aléatoire dans le processus de génération. Une valeur de graine fixe garantit des résultats reproductibles.

Informations sur la citation

Les informations de citation pour ce projet sont les suivantes :

@misc{meituanlongcatteam2025longcatvideotechnicalreport,
      title={LongCat-Video Technical Report}, 
      author={Meituan LongCat Team and Xunliang Cai and Qilong Huang and Zhuoliang Kang and Hongyu Li and Shijun Liang and Liya Ma and Siyu Ren and Xiaoming Wei and Rixu Xie and Tong Zhang},
      year={2025},
      eprint={2510.22200},
      archivePrefix={arXiv},
      primaryClass={cs.CV},
      url={https://arxiv.org/abs/2510.22200}, 
}

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp