Command Palette
Search for a command to run...
EvoSearch-codes: 進化アルゴリズムフレームワーク
Date
Size
964.11 MB
License
Apache 2.0
Paper URL

1. チュートリアルの概要

EvoSearch-codesは、香港科技大学と快手克玲チームによって2025年5月1日に開始された進化探索手法です。推論時の計算コストを増加させることでモデルの生成品質を大幅に向上させ、画像および動画生成をサポートし、最先端の拡散ベースおよびフローベースモデルと互換性があります。EvoSearchは、トレーニングや勾配更新なしで、さまざまなタスクで最先端の結果を達成し、優れたスケーリング能力、堅牢性、および汎化能力を実証しています。テスト時の計算量の増加により、EvoSearchはSD2.1とFlux.1-devがGPT-4oに匹敵、あるいは凌駕する可能性を秘めていることを示しています。動画生成においては、Wan 1.3BはWan 14BやHunyuan 13Bよりも優れた性能を示し、トレーニング時のスケーリングを補完するテスト時のスケーリングの可能性と研究の余地を示しています。関連論文も入手可能です。 テスト時間進化探索による画像およびビデオ生成のスケーリング 。
このチュートリアルでは、リソースとしてRTX A6000カード1枚を使用します。このチュートリアルでは、WANビデオ生成、SD画像生成、FLUX画像生成の3つのテスト例を提供します。
2. プロジェクト例

3. 操作手順
1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

2. 使用手順
「Bad Gateway」と表示される場合、モデルが初期化中であることを意味します。モデルが大きいため、2〜3分ほど待ってページを更新してください。
2.1 WANビデオ生成
ヒント: ビデオの生成には約 5 ~ 8 分かかります。

パラメータの説明
- 詳細設定
- ランダム シード: ランダム シード。
- 高さ: ビデオ生成の高さ。
- 幅: ビデオ生成の幅。
- ビデオの長さ: ビデオの長さを制御します。
- 推論手順: 推論手順。
- ガイダンス スケール: 生成されたビデオに対するテキスト キューの影響の強さを制御します。
- 反復: 反復回数。
2.2 SD画像生成
ヒント: プロンプト語として英語を使用することをお勧めします。

- 詳細設定
- ランダム シード: ランダム シード。
- 画像サイズ: 画像サイズ。
- 推論手順: 推論手順。
- CFG スケール: 生成された画像に対するテキスト キューの影響の強さを制御します。
- 反復: 反復回数。
2.3 FLUX画像生成

4. 議論
🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。

引用情報
このプロジェクトの引用情報は次のとおりです。
@misc{he2025scaling,
title={Scaling Image and Video Generation via Test-Time Evolutionary Search},
author={Haoran He and Jiajun Liang and Xintao Wang and Pengfei Wan and Di Zhang and Kun Gai and Ling Pan},
year={2025},
eprint={2505.17618},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.