Command Palette
Search for a command to run...
LongCat-Video: MeituanのオープンソースAIビデオ生成モデル
1. チュートリアルの概要

LongCat-Videoは、MeituanのLongCatチームによって開発された、136億個のパラメータを持つオープンソースのAI動画生成モデルです。テキストから動画への変換、画像から動画への変換、動画の連続再生といったタスクに優れており、特に高品質の長編動画を効率的に生成します。このモデルは、マルチ報酬強化学習最適化(GRPO)を採用しており、社内および公開ベンチマークテストにおいて、主要なオープンソース動画生成モデルや最先端の商用ソリューションに匹敵する性能を示しています。関連論文のタイトルは「…」です。LongCat-ビデオ技術レポート”。
このチュートリアルでは、コンピューティングパワーとして単一のRTX PRO 6000 GPUを使用します。テスト用に、画像から動画への変換、テキストから動画への変換、長編動画、動画の継続という4つの例が用意されています。
2. エフェクト表示
1. 画像から動画へ

2. テキストからビデオへ

3. 長編動画生成

4. ビデオの続き

3. 操作手順
1. コンテナを起動します

2. 使用手順
「Bad Gateway」と表示される場合は、モデルが初期化中であることを意味します。モデルのサイズが大きいため、5~6分ほどお待ちいただいてからページを更新してください。
1. 画像から動画へ

パラメータの説明:
- ネガティブプロンプト: 不要な要素を入力することで、モデルがこれらの機能を回避するように誘導し、生成されるコンテンツの品質を向上させます。
- 解像度: 生成される画像の幅 × 高さのピクセル寸法を指定します。
- シード: 生成プロセスにおけるランダム性の開始点を制御します。固定のシード値を使用することで、再現性の高い結果が得られます。
2. テキストからビデオへ

パラメータの説明:
- ネガティブプロンプト: 不要な要素を入力することで、モデルがこれらの機能を回避するように誘導し、生成されるコンテンツの品質を向上させます。
- 高さ: 生成される画像の高さを指定します。
- 幅: 生成される画像の幅を指定します。
- シード: 生成プロセスにおけるランダム性の開始点を制御します。固定のシード値を使用することで、再現性の高い結果が得られます。
3. 長編動画生成
長いビデオの生成には約 20 分かかります。

パラメータの説明:
- ネガティブプロンプト: 不要な要素を入力することで、モデルがこれらの機能を回避するように誘導し、生成されるコンテンツの品質を向上させます。
- セグメント数: セグメントの数が多いほど、ビデオの長さは長くなります。
- シード: 生成プロセスにおけるランダム性の開始点を制御します。固定のシード値を使用することで、再現性の高い結果が得られます。
4. ビデオの続き
ビデオの続きは約 20 分かかります。

パラメータの説明:
- ネガティブプロンプト: 不要な要素を入力することで、モデルがこれらの機能を回避するように誘導し、生成されるコンテンツの品質を向上させます。
- 解像度: 生成される画像の幅 × 高さのピクセル寸法を指定します。
- シード: 生成プロセスにおけるランダム性の開始点を制御します。固定のシード値を使用することで、再現性の高い結果が得られます。
引用情報
このプロジェクトの引用情報は次のとおりです。
@misc{meituanlongcatteam2025longcatvideotechnicalreport,
title={LongCat-Video Technical Report},
author={Meituan LongCat Team and Xunliang Cai and Qilong Huang and Zhuoliang Kang and Hongyu Li and Shijun Liang and Liya Ma and Siyu Ren and Xiaoming Wei and Rixu Xie and Tong Zhang},
year={2025},
eprint={2510.22200},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2510.22200},
}