HyperAI초신경

EvoSearch-codes: 진화 알고리즘 프레임워크

1. 튜토리얼 소개

GitHub 스타

EvoSearch-codes는 홍콩과학기술대학교와 콰이쇼우 켈링(Kuaishou Keling) 팀이 2025년 5월 1일에 출시한 진화 탐색(Evolutionary Search) 방법입니다. 추론 중 계산량을 늘리고, 이미지 및 비디오 생성을 지원하며, 가장 진보된 확산 기반 및 흐름 기반 모델을 지원함으로써 모델 생성 품질이 크게 향상되었습니다. EvoSearch는 학습이나 기울기 업데이트가 필요하지 않으며, 일련의 작업에서 상당한 최적 결과를 얻을 수 있으며, 우수한 확장성, 강건성 및 일반화를 보여줍니다. 테스트 중 계산량이 증가함에 따라, EvoSearch는 SD2.1과 Flux.1-dev가 GPT-4o와 동등하거나 심지어 능가할 수 있는 잠재력을 가지고 있음을 보여줍니다. 비디오 생성의 경우, Wan 1.3B는 Wan 14B와 Hunyuan 13B를 능가할 수 있으며, 이는 학습 시간 확장을 보완하기 위한 테스트 시간 확장의 잠재력과 연구 여지를 보여줍니다. 관련 논문 결과는 "테스트 시간 진화 탐색을 통한 이미지 및 비디오 생성 확장".

이 튜토리얼에서는 단일 RTX A6000 카드를 리소스로 사용합니다. WAN 비디오 생성, SD 이미지 생성, FLUX 이미지 생성의 세 가지 테스트 예제를 제공합니다.

2. 프로젝트 예시

3. 작업 단계

1. 컨테이너 시작 후 API 주소를 클릭하여 웹 인터페이스로 진입합니다.

2. 사용 단계

"잘못된 게이트웨이"가 표시되면 모델이 초기화 중임을 의미합니다. 모델이 크기 때문에 약 2~3분 정도 기다리신 후 페이지를 새로고침해 주시기 바랍니다.

2.1 WAN 비디오 생성

팁: 영상을 생성하는 데 약 5~8분이 소요됩니다.

매개변수 설명

  • 고급 설정
    • 랜덤 시드: 랜덤 시드.
    • 높이: 비디오 생성 높이.
    • 너비: 비디오 생성 너비.
    • 비디오 길이: 비디오 길이를 제어합니다.
    • 추론 단계: 추론 단계.
    • 지침 척도: 생성된 비디오에 대한 텍스트 단서의 영향 강도를 제어합니다.
    • 반복: 반복 횟수.

2.2 SD 이미지 생성

팁: 프롬프트 단어로 영어를 사용하는 것이 더 좋습니다.

  • 고급 설정
    • 랜덤 시드: 랜덤 시드.
    • 이미지 크기: 이미지 크기.
    • 추론 단계: 추론 단계.
    • CFG 스케일: 생성된 이미지에 대한 텍스트 단서의 영향 강도를 제어합니다.
    • 반복: 반복 횟수.

2.3 FLUX 이미지 생성

4. 토론

🖌️ 고품질 프로젝트를 발견하시면, 백그라운드에 메시지를 남겨 추천해주세요! 또한, 튜토리얼 교환 그룹도 만들었습니다. 친구들의 QR코드 스캔과 [SD 튜토리얼] 댓글을 통해 그룹에 가입하여 다양한 기술 이슈에 대해 논의하고 신청 결과를 공유해 주시기 바랍니다.↓

인용 정보

이 프로젝트에 대한 인용 정보는 다음과 같습니다.

@misc{he2025scaling,
    title={Scaling Image and Video Generation via Test-Time Evolutionary Search},
    author={Haoran He and Jiajun Liang and Xintao Wang and Pengfei Wan and Di Zhang and Kun Gai and Ling Pan},
    year={2025},
    eprint={2505.17618},
    archivePrefix={arXiv},
    primaryClass={cs.CV}
}