@misc{meituanlongcatteam2025longcatvideotechnicalreport, title={LongCat-Video Technical Report}, author={Meituan LongCat Team and Xunliang Cai and Qilong Huang and Zhuoliang Kang and Hongyu Li and Shijun Liang and Liya Ma and Siyu Ren and Xiaoming Wei and Rixu Xie and Tong Zhang}, year={2025}, eprint={2510.22200}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2510.22200}, }

날짜

8달 전

조직

태그

비디오 생성

RTX 5090

논문 URL

2510.22200

라이선스

MIT

GitHub

meituan-longcat/LongCat-Video5.3k

1. 튜토리얼 소개

LongCat-Video는 메이투안의 LongCat 팀에서 개발한 136억 개의 파라미터를 가진 오픈 소스 AI 비디오 생성 모델입니다. 텍스트를 비디오로 변환하거나, 이미지를 비디오로 변환하고, 비디오를 연속 재생하는 등의 작업, 특히 고품질의 긴 비디오를 효율적으로 생성하는 데 탁월한 성능을 보입니다. 이 모델은 다중 보상 강화 학습 최적화(GRPO) 기법을 활용하며, 내부 및 공개 벤치마크에서 주요 오픈 소스 비디오 생성 모델 및 최첨단 상용 솔루션과 유사한 성능을 입증했습니다. 관련 연구 논문은 별도로 제공됩니다. LongCat-비디오 기술 보고서 .

이 튜토리얼에서는 컴퓨팅 성능 향상을 위해 단일 RTX PRO 6000 GPU를 사용합니다. 테스트를 위해 이미지-비디오 변환, 텍스트-비디오 변환, 긴 비디오 변환, 비디오 연속 변환의 네 가지 예시가 제공됩니다.

2. 효과 표시

1. 이미지-비디오 변환

2. 텍스트-비디오 변환

3. 장편 영상 제작

4. 비디오 연속

3. 작업 단계

1. 컨테이너를 시작하세요

2. 사용 단계

"잘못된 게이트웨이"가 표시되면 모델이 초기화 중임을 의미합니다. 모델 용량이 크므로 5~6분 정도 기다린 후 페이지를 새로 고쳐주세요.

1. 이미지-비디오 변환

매개변수 설명:

부정적 프롬프트: 원치 않는 요소를 입력함으로써 모델이 이러한 특징을 피하도록 안내하여 생성된 콘텐츠의 품질을 향상시킵니다.
해상도: 생성된 이미지의 너비 × 높이 픽셀 크기를 지정합니다.
시드: 생성 과정에서 무작위성의 시작점을 제어합니다. 고정된 시드 값은 재현 가능한 결과를 보장합니다.

2. 텍스트-비디오 변환

매개변수 설명:

부정적 프롬프트: 원치 않는 요소를 입력함으로써 모델이 이러한 특징을 피하도록 안내하여 생성된 콘텐츠의 품질을 향상시킵니다.
높이: 생성된 이미지의 높이를 지정합니다.
너비: 생성된 이미지의 너비를 지정합니다.
시드: 생성 과정에서 무작위성의 시작점을 제어합니다. 고정된 시드 값은 재현 가능한 결과를 보장합니다.

3. 장편 영상 제작

긴 영상을 생성하는 데는 약 20분이 걸립니다.

매개변수 설명:

부정적 프롬프트: 원치 않는 요소를 입력함으로써 모델이 이러한 특징을 피하도록 안내하여 생성된 콘텐츠의 품질을 향상시킵니다.
세그먼트 수: 세그먼트가 많을수록 영상이 길어집니다.
시드: 생성 과정에서 무작위성의 시작점을 제어합니다. 고정된 시드 값은 재현 가능한 결과를 보장합니다.

4. 비디오 연속

영상의 연속은 약 20분 정도입니다.

매개변수 설명:

부정적 프롬프트: 원치 않는 요소를 입력함으로써 모델이 이러한 특징을 피하도록 안내하여 생성된 콘텐츠의 품질을 향상시킵니다.
해상도: 생성된 이미지의 너비 × 높이 픽셀 크기를 지정합니다.
시드: 생성 과정에서 무작위성의 시작점을 제어합니다. 고정된 시드 값은 재현 가능한 결과를 보장합니다.

인용 정보

이 프로젝트에 대한 인용 정보는 다음과 같습니다.

@misc{meituanlongcatteam2025longcatvideotechnicalreport,
      title={LongCat-Video Technical Report}, 
      author={Meituan LongCat Team and Xunliang Cai and Qilong Huang and Zhuoliang Kang and Hongyu Li and Shijun Liang and Liya Ma and Siyu Ren and Xiaoming Wei and Rixu Xie and Tong Zhang},
      year={2025},
      eprint={2510.22200},
      archivePrefix={arXiv},
      primaryClass={cs.CV},
      url={https://arxiv.org/abs/2510.22200}, 
}

Notebook 개요

수준

입문

주제

주요 프레임워크 가이드 생성형 AI 컴퓨터 비전

HunyuanVideo-1.5 비디오 생성 모델

5달 전

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

Command Palette

LongCat-Video: Meituan의 오픈소스 AI 비디오 생성 모델

1. 튜토리얼 소개

2. 효과 표시

1. 이미지-비디오 변환

2. 텍스트-비디오 변환

3. 장편 영상 제작

4. 비디오 연속

3. 작업 단계

1. 컨테이너를 시작하세요

2. 사용 단계

1. 이미지-비디오 변환

2. 텍스트-비디오 변환

3. 장편 영상 제작

4. 비디오 연속

인용 정보

Notebook 개요

AI로 AI 구축

HyperAI Newsletters

Command Palette

LongCat-Video: Meituan의 오픈소스 AI 비디오 생성 모델

1. 튜토리얼 소개

2. 효과 표시

1. 이미지-비디오 변환

2. 텍스트-비디오 변환

3. 장편 영상 제작

4. 비디오 연속

3. 작업 단계

1. 컨테이너를 시작하세요

2. 사용 단계

1. 이미지-비디오 변환

2. 텍스트-비디오 변환

3. 장편 영상 제작

4. 비디오 연속

인용 정보

Notebook 개요

HunyuanVideo-1.5 비디오 생성 모델

AI로 AI 구축

HyperAI Newsletters

Command Palette

LongCat-Video: Meituan의 오픈소스 AI 비디오 생성 모델

1. 튜토리얼 소개

2. 효과 표시

1. 이미지-비디오 변환

2. 텍스트-비디오 변환

3. 장편 영상 제작

4. 비디오 연속

3. 작업 단계

1. 컨테이너를 시작하세요

2. 사용 단계

1. 이미지-비디오 변환

2. 텍스트-비디오 변환

3. 장편 영상 제작

4. 비디오 연속

인용 정보

Notebook 개요

HunyuanVideo-1.5 비디오 생성 모델

AI로 AI 구축

HyperAI Newsletters

HunyuanVideo-1.5 비디오 생성 모델

HunyuanVideo-1.5 비디오 생성 모델