Command Palette
Search for a command to run...
EvoSearch-codes: 진화 알고리즘 프레임워크
GPU 컴퓨팅 에어드롭

1. 튜토리얼 소개

홍콩과학기술대학교와 Kuaishou Keling 연구팀이 2025년 5월 1일에 출시한 EvoSearch-codes는 진화 탐색(Evolutionary Search) 방법입니다. 이 방법은 추론 과정에서 계산 비용을 증가시켜 모델 생성 품질을 크게 향상시키며, 이미지 및 비디오 생성을 지원하고 최첨단 확산 기반 및 흐름 기반 모델과 호환됩니다. EvoSearch는 학습이나 기울기 업데이트 없이 다양한 작업에서 최첨단 성능을 달성하여 뛰어난 확장성, 견고성 및 일반화 능력을 보여줍니다. 테스트 시간 계산량을 증가시키면 EvoSearch는 SD2.1과 Flux.1-dev가 GPT-4o와 경쟁하거나 이를 능가할 가능성을 보여줍니다. 비디오 생성에서는 Wan 1.3B가 Wan 14B와 Hunyuan 13B보다 우수한 성능을 보여 테스트 시간 확장이 학습 시간 확장을 보완할 수 있는 잠재력과 연구 영역을 제시합니다. 관련 논문은 검색 가능합니다. 테스트 시간 진화 탐색을 통한 이미지 및 비디오 생성 확장 .
이 튜토리얼에서는 단일 RTX A6000 카드를 리소스로 사용합니다. WAN 비디오 생성, SD 이미지 생성, FLUX 이미지 생성의 세 가지 테스트 예제를 제공합니다.
2. 프로젝트 예시

3. 작업 단계
1. 컨테이너 시작 후 API 주소를 클릭하여 웹 인터페이스로 진입합니다.

2. 사용 단계
"잘못된 게이트웨이"가 표시되면 모델이 초기화 중임을 의미합니다. 모델이 크기 때문에 약 2~3분 정도 기다리신 후 페이지를 새로고침해 주시기 바랍니다.
2.1 WAN 비디오 생성
팁: 영상을 생성하는 데 약 5~8분이 소요됩니다.

매개변수 설명
- 고급 설정
- 랜덤 시드: 랜덤 시드.
- 높이: 비디오 생성 높이.
- 너비: 비디오 생성 너비.
- 비디오 길이: 비디오 길이를 제어합니다.
- 추론 단계: 추론 단계.
- 지침 척도: 생성된 비디오에 대한 텍스트 단서의 영향 강도를 제어합니다.
- 반복: 반복 횟수.
2.2 SD 이미지 생성
팁: 프롬프트 단어로 영어를 사용하는 것이 더 좋습니다.

- 고급 설정
- 랜덤 시드: 랜덤 시드.
- 이미지 크기: 이미지 크기.
- 추론 단계: 추론 단계.
- CFG 스케일: 생성된 이미지에 대한 텍스트 단서의 영향 강도를 제어합니다.
- 반복: 반복 횟수.
2.3 FLUX 이미지 생성

4. 토론
🖌️ 고품질 프로젝트를 발견하시면, 백그라운드에 메시지를 남겨 추천해주세요! 또한, 튜토리얼 교환 그룹도 만들었습니다. 친구들의 QR코드 스캔과 [SD 튜토리얼] 댓글을 통해 그룹에 가입하여 다양한 기술 이슈에 대해 논의하고 신청 결과를 공유해 주시기 바랍니다.↓

인용 정보
이 프로젝트에 대한 인용 정보는 다음과 같습니다.
@misc{he2025scaling,
title={Scaling Image and Video Generation via Test-Time Evolutionary Search},
author={Haoran He and Jiajun Liang and Xintao Wang and Pengfei Wan and Di Zhang and Kun Gai and Ling Pan},
year={2025},
eprint={2505.17618},
archivePrefix={arXiv},
primaryClass={cs.CV}
}