Command Palette
Search for a command to run...
LongCat-Video: Meituan의 오픈소스 AI 비디오 생성 모델
GPU 컴퓨팅 에어드롭
1. 튜토리얼 소개

LongCat-Video는 메이투안의 LongCat 팀에서 개발한 136억 개의 파라미터를 가진 오픈 소스 AI 비디오 생성 모델입니다. 텍스트를 비디오로 변환하거나, 이미지를 비디오로 변환하고, 비디오를 연속 재생하는 등의 작업, 특히 고품질의 긴 비디오를 효율적으로 생성하는 데 탁월한 성능을 보입니다. 이 모델은 다중 보상 강화 학습 최적화(GRPO) 기법을 활용하며, 내부 및 공개 벤치마크에서 주요 오픈 소스 비디오 생성 모델 및 최첨단 상용 솔루션과 유사한 성능을 입증했습니다. 관련 연구 논문은 별도로 제공됩니다. LongCat-비디오 기술 보고서 .
이 튜토리얼에서는 컴퓨팅 성능 향상을 위해 단일 RTX PRO 6000 GPU를 사용합니다. 테스트를 위해 이미지-비디오 변환, 텍스트-비디오 변환, 긴 비디오 변환, 비디오 연속 변환의 네 가지 예시가 제공됩니다.
2. 효과 표시
1. 이미지-비디오 변환

2. 텍스트-비디오 변환

3. 장편 영상 제작

4. 비디오 연속

3. 작업 단계
1. 컨테이너를 시작하세요

2. 사용 단계
"잘못된 게이트웨이"가 표시되면 모델이 초기화 중임을 의미합니다. 모델 용량이 크므로 5~6분 정도 기다린 후 페이지를 새로 고쳐주세요.
1. 이미지-비디오 변환

매개변수 설명:
- 부정적 프롬프트: 원치 않는 요소를 입력함으로써 모델이 이러한 특징을 피하도록 안내하여 생성된 콘텐츠의 품질을 향상시킵니다.
- 해상도: 생성된 이미지의 너비 × 높이 픽셀 크기를 지정합니다.
- 시드: 생성 과정에서 무작위성의 시작점을 제어합니다. 고정된 시드 값은 재현 가능한 결과를 보장합니다.
2. 텍스트-비디오 변환

매개변수 설명:
- 부정적 프롬프트: 원치 않는 요소를 입력함으로써 모델이 이러한 특징을 피하도록 안내하여 생성된 콘텐츠의 품질을 향상시킵니다.
- 높이: 생성된 이미지의 높이를 지정합니다.
- 너비: 생성된 이미지의 너비를 지정합니다.
- 시드: 생성 과정에서 무작위성의 시작점을 제어합니다. 고정된 시드 값은 재현 가능한 결과를 보장합니다.
3. 장편 영상 제작
긴 영상을 생성하는 데는 약 20분이 걸립니다.

매개변수 설명:
- 부정적 프롬프트: 원치 않는 요소를 입력함으로써 모델이 이러한 특징을 피하도록 안내하여 생성된 콘텐츠의 품질을 향상시킵니다.
- 세그먼트 수: 세그먼트가 많을수록 영상이 길어집니다.
- 시드: 생성 과정에서 무작위성의 시작점을 제어합니다. 고정된 시드 값은 재현 가능한 결과를 보장합니다.
4. 비디오 연속
영상의 연속은 약 20분 정도입니다.

매개변수 설명:
- 부정적 프롬프트: 원치 않는 요소를 입력함으로써 모델이 이러한 특징을 피하도록 안내하여 생성된 콘텐츠의 품질을 향상시킵니다.
- 해상도: 생성된 이미지의 너비 × 높이 픽셀 크기를 지정합니다.
- 시드: 생성 과정에서 무작위성의 시작점을 제어합니다. 고정된 시드 값은 재현 가능한 결과를 보장합니다.
인용 정보
이 프로젝트에 대한 인용 정보는 다음과 같습니다.
@misc{meituanlongcatteam2025longcatvideotechnicalreport,
title={LongCat-Video Technical Report},
author={Meituan LongCat Team and Xunliang Cai and Qilong Huang and Zhuoliang Kang and Hongyu Li and Shijun Liang and Liya Ma and Siyu Ren and Xiaoming Wei and Rixu Xie and Tong Zhang},
year={2025},
eprint={2510.22200},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2510.22200},
}