Command Palette
Search for a command to run...
Allegro 비디오 생성 데모
GPU 컴퓨팅 에어드롭

튜토리얼 소개
该教程至少需要 NVIDIA RTX A6000 48GB 启动。
Allegro는 2024년 Rhymes AI에서 개발한 최첨단 텍스트-비디오 변환 모델입니다. 기본적인 텍스트 입력을 고화질 비디오 콘텐츠로 변환할 수 있으며, 특히 720p 해상도, 초당 15프레임의 부드러운 재생, 최대 6초 길이의 영상을 구현합니다. 관련 연구 논문을 참고하십시오. Allegro: 상업 수준 비디오 생성 모델의 블랙박스를 열어보세요 이 모델은 뛰어난 비디오 합성 성능을 보여주며, 품질과 시간적 일관성 모두에서 탁월한 결과를 제공합니다. 설명 텍스트를 기반으로 동적인 시각 콘텐츠를 신속하게 생성하여 콘텐츠 제작자에게 유연하고 제어 가능한 비디오 제작 방식을 제공합니다. 사용자 연구 결과, Allegro 모델은 기존 오픈 소스 모델 및 대부분의 상용 모델보다 우수한 성능을 보였습니다. 또한 Allegro는 모델 확장, 큐 정제 적응성, 비디오 분할기 설계 등 향상된 기본 기능에 대한 심층적인 정보와 지침을 제공합니다. 이러한 개선 사항들은 입력 텍스트의 서술적 세부 정보를 바탕으로 복잡한 비디오 콘텐츠를 생성하는 모델의 능력을 향상시킵니다.
이 튜토리얼은 모델 추론 튜토리얼입니다. 모델이 비디오를 생성하는 데 시간이 오래 걸리므로, 이 튜토리얼에서는 5초 분량의 비디오만 생성할 수 있습니다(약 40분 소요).
실행 단계
컨테이너를 복제하고 시작한 후 API 주소를 클릭하여 웹 인터페이스로 들어갑니다.

1. 텍스트 생성 비디오
- 텍스트 프롬프트를 입력하고 제출을 클릭하세요(모델을 로드하는 데 약 30초가 걸리고, 그 후 진행률 표시줄이 표시되고 비디오 생성이 시작됩니다. 5초 분량의 비디오를 생성하는 데 약 40분이 걸립니다. 잠시만 기다려 주세요.)
아래 그림과 같이

- 비디오가 생성되면 진행률 표시줄이 자동으로 비디오 재생으로 변경됩니다.
아래 그림과 같이

2. 비디오 다운로드
- 영상 오른쪽에 있는 다운로드 버튼을 클릭하면 영상을 다운로드할 수 있습니다.
아래 그림과 같이

교류 및 토론
🖌️ 고품질 프로젝트를 발견하시면, 백그라운드에 메시지를 남겨 추천해주세요! 또한, 튜토리얼 교환 그룹도 만들었습니다. 친구들의 QR코드 스캔과 [SD 튜토리얼] 댓글을 통해 그룹에 가입하여 다양한 기술 이슈에 대해 논의하고 신청 결과를 공유해 주시기 바랍니다.↓
