HyperAIHyperAI

Command Palette

Search for a command to run...

LongCat-Video : Le Modèle De Génération Vidéo IA Open Source De Meituan

1. Introduction au tutoriel

Construire

LongCat-Video est un modèle de génération vidéo open source basé sur l'IA et doté de 13,6 milliards de paramètres, développé par l'équipe LongCat de Meituan. Il excelle dans des tâches telles que la conversion de texte en vidéo, d'image en vidéo et la continuation de vidéos, notamment pour la génération efficace de longues vidéos de haute qualité. Ce modèle utilise l'optimisation par apprentissage par renforcement à récompenses multiples (GRPO) et affiche des performances comparables à celles des principaux modèles open source de génération vidéo et des solutions commerciales de pointe, comme l'ont démontré des tests de référence internes et publics. L'article associé est intitulé « … ».Rapport technique LongCat-Video".

Ce tutoriel utilise une seule carte graphique RTX PRO 6000 pour la puissance de calcul. Quatre exemples sont fournis à titre de test : conversion d’image en vidéo, conversion de texte en vidéo, vidéo longue et lecture de la suite vidéo.

2. Affichage des effets

1. Image en vidéo

2. Conversion de texte en vidéo

3. Génération de vidéos longues

4. Suite de la vidéo

3. Étapes de l'opération

1. Démarrez le conteneur

2. Étapes d'utilisation

Si le message « Bad Gateway » s'affiche, cela signifie que le modèle est en cours d'initialisation. Ce modèle étant volumineux, veuillez patienter 5 à 6 minutes, puis actualiser la page.

1. Image en vidéo

Description des paramètres :

  • Suggestion négative : En saisissant des éléments indésirables, elle guide le modèle afin qu’il évite ces caractéristiques, améliorant ainsi la qualité du contenu généré.
  • Résolution : Spécifie les dimensions en pixels (largeur × hauteur) de l’image générée.
  • Graine : contrôle le point de départ de l’aléatoire dans le processus de génération. Une valeur de graine fixe garantit des résultats reproductibles.

2. Conversion de texte en vidéo

Description des paramètres :

  • Suggestion négative : En saisissant des éléments indésirables, elle guide le modèle afin qu’il évite ces caractéristiques, améliorant ainsi la qualité du contenu généré.
  • Hauteur : Spécifie la hauteur de l’image générée.
  • Largeur : Spécifie la largeur de l’image générée.
  • Graine : contrôle le point de départ de l’aléatoire dans le processus de génération. Une valeur de graine fixe garantit des résultats reproductibles.

3. Génération de vidéos longues

La génération de vidéos longues prend environ 20 minutes.

Description des paramètres :

  • Suggestion négative : En saisissant des éléments indésirables, elle guide le modèle afin qu’il évite ces caractéristiques, améliorant ainsi la qualité du contenu généré.
  • Nombre de segments : Plus il y a de segments, plus la vidéo est longue.
  • Graine : contrôle le point de départ de l’aléatoire dans le processus de génération. Une valeur de graine fixe garantit des résultats reproductibles.

4. Suite de la vidéo

La suite de la vidéo dure environ 20 minutes.

Description des paramètres :

  • Suggestion négative : En saisissant des éléments indésirables, elle guide le modèle afin qu’il évite ces caractéristiques, améliorant ainsi la qualité du contenu généré.
  • Résolution : Spécifie les dimensions en pixels (largeur × hauteur) de l’image générée.
  • Graine : contrôle le point de départ de l’aléatoire dans le processus de génération. Une valeur de graine fixe garantit des résultats reproductibles.

Informations sur la citation

Les informations de citation pour ce projet sont les suivantes :

@misc{meituanlongcatteam2025longcatvideotechnicalreport,
      title={LongCat-Video Technical Report}, 
      author={Meituan LongCat Team and Xunliang Cai and Qilong Huang and Zhuoliang Kang and Hongyu Li and Shijun Liang and Liya Ma and Siyu Ren and Xiaoming Wei and Rixu Xie and Tong Zhang},
      year={2025},
      eprint={2510.22200},
      archivePrefix={arXiv},
      primaryClass={cs.CV},
      url={https://arxiv.org/abs/2510.22200}, 
}

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp