HyperAI초신경

MAGI-1: 세계 최초의 대규모 자기회귀 비디오 생성 모델

1. 튜토리얼 소개

짓다

Magi-1은 중국 인공지능 기업 Send AI가 개발하여 2025년 4월 21일 공식 출시한 세계 최초의 대규모 자기회귀 비디오 생성 모델입니다. 연속된 프레임의 고정 길이 세그먼트로 정의된 일련의 비디오 블록을 자기회귀적으로 예측하여 비디오를 생성합니다. MAGI-1은 시간 경과에 따라 단조롭게 증가하는 각 노이즈 블록의 노이즈를 제거하도록 훈련되었으며, 인과적 시간 모델링을 지원하고 자연스럽게 스트리밍 생성을 지원합니다. 텍스트 명령어를 기반으로 하는 이미지-비디오 작업에서 뛰어난 성능을 발휘하며, 여러 알고리즘 혁신과 전용 인프라 스택을 통해 높은 시간적 일관성과 확장성을 제공합니다. 관련 논문 결과는 다음과 같습니다.MAGI-1: 대규모 자기회귀 비디오 생성".

이 튜토리얼에서는 단일 RTX 4090 카드에 대한 리소스를 사용하며, 텍스트는 영어만 지원합니다.

2. 프로젝트 예시

텍스트-비디오 모드

영상

이미지-비디오 모드

영상

비디오 대 비디오 모드

영상

3. 작업 단계

1. 컨테이너 시작 후 API 주소를 클릭하여 웹 인터페이스로 진입합니다.

2. 웹페이지에 접속 후 모델과 언어대화를 시작할 수 있습니다.

"잘못된 게이트웨이"가 표시되면 모델이 초기화 중임을 의미합니다. 모델이 크기 때문에 1~2분 정도 기다린 후 페이지를 새로고침해 주세요. 모델에서 동영상을 생성하는 데 약 5분 정도 소요되므로 잠시 기다려 주세요.

사용 방법

텍스트-비디오 모델

텍스트 콘텐츠로 비디오 프레임 생성

이미지에서 비디오 모델로

비디오 프레임을 생성하기 위해 이미지를 참조로 입력합니다.

비디오 대 비디오 모델

비디오를 참조로 입력하여 비디오 프레임을 생성합니다.

/openbayes/home/MAGI-1/example/4.5B 경로에 있는 4.5B_distill_quant_config.json 파일의 runtime_config에서 생성된 비디오의 매개변수(예: num_frames, video_size_h, video_size_w, fps)를 변경할 수 있습니다.

4. 토론

🖌️ 고품질 프로젝트를 발견하시면, 백그라운드에 메시지를 남겨 추천해주세요! 또한, 튜토리얼 교환 그룹도 만들었습니다. 친구들의 QR코드 스캔과 [SD 튜토리얼] 댓글을 통해 그룹에 가입하여 다양한 기술 이슈에 대해 논의하고 신청 결과를 공유해 주시기 바랍니다.↓

V. 인용 정보

GitHub 사용자에게 감사드립니다 키아스디크  이 튜토리얼을 배포하기 위한 프로젝트 참조 정보는 다음과 같습니다.

@misc{ai2025magi1autoregressivevideogeneration,
      title={MAGI-1: Autoregressive Video Generation at Scale},
      author={Sand. ai and Hansi Teng and Hongyu Jia and Lei Sun and Lingzhi Li and Maolin Li and Mingqiu Tang and Shuai Han and Tianning Zhang and W. Q. Zhang and Weifeng Luo and Xiaoyang Kang and Yuchen Sun and Yue Cao and Yunpeng Huang and Yutong Lin and Yuxin Fang and Zewei Tao and Zheng Zhang and Zhongshu Wang and Zixun Liu and Dai Shi and Guoli Su and Hanwen Sun and Hong Pan and Jie Wang and Jiexin Sheng and Min Cui and Min Hu and Ming Yan and Shucheng Yin and Siran Zhang and Tingting Liu and Xianping Yin and Xiaoyu Yang and Xin Song and Xuan Hu and Yankai Zhang and Yuqiao Li},
      year={2025},
      eprint={2505.13211},
      archivePrefix={arXiv},
      primaryClass={cs.CV},
      url={https://arxiv.org/abs/2505.13211},
}