EvoSearch-codes: 진화 알고리즘 프레임워크

1. 튜토리얼 소개

EvoSearch-codes는 홍콩과학기술대학교와 콰이쇼우 켈링(Kuaishou Keling) 팀이 2025년 5월 1일에 출시한 진화 탐색(Evolutionary Search) 방법입니다. 추론 중 계산량을 늘리고, 이미지 및 비디오 생성을 지원하며, 가장 진보된 확산 기반 및 흐름 기반 모델을 지원함으로써 모델 생성 품질이 크게 향상되었습니다. EvoSearch는 학습이나 기울기 업데이트가 필요하지 않으며, 일련의 작업에서 상당한 최적 결과를 얻을 수 있으며, 우수한 확장성, 강건성 및 일반화를 보여줍니다. 테스트 중 계산량이 증가함에 따라, EvoSearch는 SD2.1과 Flux.1-dev가 GPT-4o와 동등하거나 심지어 능가할 수 있는 잠재력을 가지고 있음을 보여줍니다. 비디오 생성의 경우, Wan 1.3B는 Wan 14B와 Hunyuan 13B를 능가할 수 있으며, 이는 학습 시간 확장을 보완하기 위한 테스트 시간 확장의 잠재력과 연구 여지를 보여줍니다. 관련 논문 결과는 "테스트 시간 진화 탐색을 통한 이미지 및 비디오 생성 확장".
이 튜토리얼에서는 단일 RTX A6000 카드를 리소스로 사용합니다. WAN 비디오 생성, SD 이미지 생성, FLUX 이미지 생성의 세 가지 테스트 예제를 제공합니다.
2. 프로젝트 예시

3. 작업 단계
1. 컨테이너 시작 후 API 주소를 클릭하여 웹 인터페이스로 진입합니다.

2. 사용 단계
"잘못된 게이트웨이"가 표시되면 모델이 초기화 중임을 의미합니다. 모델이 크기 때문에 약 2~3분 정도 기다리신 후 페이지를 새로고침해 주시기 바랍니다.
2.1 WAN 비디오 생성
팁: 영상을 생성하는 데 약 5~8분이 소요됩니다.

매개변수 설명
- 고급 설정
- 랜덤 시드: 랜덤 시드.
- 높이: 비디오 생성 높이.
- 너비: 비디오 생성 너비.
- 비디오 길이: 비디오 길이를 제어합니다.
- 추론 단계: 추론 단계.
- 지침 척도: 생성된 비디오에 대한 텍스트 단서의 영향 강도를 제어합니다.
- 반복: 반복 횟수.
2.2 SD 이미지 생성
팁: 프롬프트 단어로 영어를 사용하는 것이 더 좋습니다.

- 고급 설정
- 랜덤 시드: 랜덤 시드.
- 이미지 크기: 이미지 크기.
- 추론 단계: 추론 단계.
- CFG 스케일: 생성된 이미지에 대한 텍스트 단서의 영향 강도를 제어합니다.
- 반복: 반복 횟수.
2.3 FLUX 이미지 생성

4. 토론
🖌️ 고품질 프로젝트를 발견하시면, 백그라운드에 메시지를 남겨 추천해주세요! 또한, 튜토리얼 교환 그룹도 만들었습니다. 친구들의 QR코드 스캔과 [SD 튜토리얼] 댓글을 통해 그룹에 가입하여 다양한 기술 이슈에 대해 논의하고 신청 결과를 공유해 주시기 바랍니다.↓

인용 정보
이 프로젝트에 대한 인용 정보는 다음과 같습니다.
@misc{he2025scaling,
title={Scaling Image and Video Generation via Test-Time Evolutionary Search},
author={Haoran He and Jiajun Liang and Xintao Wang and Pengfei Wan and Di Zhang and Kun Gai and Ling Pan},
year={2025},
eprint={2505.17618},
archivePrefix={arXiv},
primaryClass={cs.CV}
}