HyperAI초신경

1. 튜토리얼 소개

Wan-2.2는 알리바바의 통이완샹 연구실에서 2025년 7월 28일 오픈소스로 공개한 고급 AI 비디오 생성 모델입니다. 텍스트 생성 비디오(Wan2.2-T2V-A14B), 이미지 생성 비디오(Wan2.2-I2V-A14B), 통합 비디오 생성(Wan2.2-IT2V-5B)의 세 가지 모델이 오픈소스로 공개되었으며, 총 270억 개의 매개변수를 가집니다. 이 모델은 전문가 혼합(MoE) 아키텍처를 최초로 도입하여 생성 품질과 연산 효율성을 효과적으로 향상시켰습니다. 동시에 빛, 그림자, 색상, 구도 등의 미적 효과를 정확하게 제어할 수 있는 영화 수준의 미적 제어 시스템을 선도했습니다. 본 튜토리얼에서 사용된 5B 매개변수 컴팩트 비디오 생성 모델은 텍스트 및 이미지 생성 비디오를 지원하고, 일반 소비자용 그래픽 카드에서 실행 가능하며, 효율적인 3D VAE 아키텍처를 기반으로 높은 압축률과 고화질 비디오를 빠르게 생성할 수 있습니다. 관련 논문 결과는 다음과 같습니다.Wan: 개방형 고급 대규모 비디오 생성 모델".

이 튜토리얼에서는 단일 RTX A6000 GPU를 컴퓨팅 리소스로 사용하고 Wan2.2-IT2V-5B 모델을 배포합니다. 테스트를 위해 텍스트-비디오 생성과 이미지-비디오 생성의 두 가지 예제가 제공됩니다.

2. 효과 표시

텍스트 생성 비디오

이미지 생성 비디오

3. 작업 단계

1. 컨테이너를 시작하세요

2. 사용 단계

"잘못된 게이트웨이"가 표시되면 모델이 초기화 중임을 의미합니다. 모델이 크기 때문에 약 2~3분 정도 기다리신 후 페이지를 새로고침해 주시기 바랍니다.

1. 텍스트-비디오 생성

구체적인 매개변수:

프롬프트: 생성하려는 비디오 콘텐츠를 설명하는 텍스트입니다.
기간: 원하는 비디오 기간(초)을 지정합니다.
출력 해상도: 생성된 비디오의 해상도(폭 x 높이)를 선택하세요.
샘플링 단계: 비디오 생성 중 반복적 최적화의 수(확산 모델의 노이즈 제거 단계 수)를 제어합니다.
안내 척도: 모델이 사용자의 지시어를 얼마나 잘 따르는지 제어합니다.
샘플 이동: 사용된 샘플러와 관련하여 샘플링 프로세스 매개변수를 조정하는 데 사용됩니다.
시드: 생성 프로세스의 무작위성을 제어합니다.

2. 이미지-비디오 생성

4. 토론

🖌️ 고품질 프로젝트를 발견하시면, 백그라운드에 메시지를 남겨 추천해주세요! 또한, 튜토리얼 교환 그룹도 만들었습니다. 친구들의 QR코드 스캔과 [SD 튜토리얼] 댓글을 통해 그룹에 가입하여 다양한 기술 이슈에 대해 논의하고 신청 결과를 공유해 주시기 바랍니다.↓

인용 정보

이 프로젝트에 대한 인용 정보는 다음과 같습니다.

@article{wan2025,
      title={Wan: Open and Advanced Large-Scale Video Generative Models}, 
      author={Team Wan and Ang Wang and Baole Ai and Bin Wen and Chaojie Mao and Chen-Wei Xie and Di Chen and Feiwu Yu and Haiming Zhao and Jianxiao Yang and Jianyuan Zeng and Jiayu Wang and Jingfeng Zhang and Jingren Zhou and Jinkai Wang and Jixuan Chen and Kai Zhu and Kang Zhao and Keyu Yan and Lianghua Huang and Mengyang Feng and Ningyi Zhang and Pandeng Li and Pingyu Wu and Ruihang Chu and Ruili Feng and Shiwei Zhang and Siyang Sun and Tao Fang and Tianxing Wang and Tianyi Gui and Tingyu Weng and Tong Shen and Wei Lin and Wei Wang and Wei Wang and Wenmeng Zhou and Wente Wang and Wenting Shen and Wenyuan Yu and Xianzhong Shi and Xiaoming Huang and Xin Xu and Yan Kou and Yangyu Lv and Yifei Li and Yijing Liu and Yiming Wang and Yingya Zhang and Yitong Huang and Yong Li and You Wu and Yu Liu and Yulin Pan and Yun Zheng and Yuntao Hong and Yupeng Shi and Yutong Feng and Zeyinzi Jiang and Zhen Han and Zhi-Fan Wu and Ziyu Liu},
      journal = {arXiv preprint arXiv:2503.20314},
      year={2025}
}

Wan2.2: 오픈소스 고수준 대규모 비디오 생성 모델

1. 튜토리얼 소개

2. 효과 표시

텍스트 생성 비디오

이미지 생성 비디오

3. 작업 단계

1. 컨테이너를 시작하세요

2. 사용 단계

1. 텍스트-비디오 생성

2. 이미지-비디오 생성

4. 토론

인용 정보

AI로 AI 구축

Hyper Newsletters

Command Palette

Wan2.2: 오픈소스 고수준 대규모 비디오 생성 모델

1. 튜토리얼 소개

2. 효과 표시

텍스트 생성 비디오

이미지 생성 비디오

3. 작업 단계

1. 컨테이너를 시작하세요

2. 사용 단계

1. 텍스트-비디오 생성

2. 이미지-비디오 생성

4. 토론

인용 정보

AI로 AI 구축

Hyper Newsletters