HyperAIHyperAI

Command Palette

Search for a command to run...

EasyControl ジブリ風画像生成デモ

Date

10ヶ月前

Size

328.53 MB

License

Apache 2.0

Paper URL

2503.07027

エフェクト例

1. チュートリアルの概要

EasyControlは、拡散変圧器に効率的かつ柔軟な制御機能を追加することを目的としたプロジェクトです。2025年にTiamat AI、上海科技大学、シンガポール国立大学、Liblib AIによって共同開発されました。関連研究論文には以下が含まれます… EasyControl: 拡散変圧器に効率的かつ柔軟な制御を追加 拡散モデルアーキテクチャがUnetベースの構造からDiffusion Transformer(DiT)へと移行するにつれ、既存のDiTエコシステムは成熟したプラグインサポートを欠き、効率性のボトルネック、複数条件調整における競合、モデル適応性の不足といった問題に直面しています。これらの問題に対処するため、EasyControlは効率的で柔軟な統合条件付きDiTフレームワークを提案します。軽量な条件付き注入LoRAモジュール、位置認識型トレーニングパラダイムを導入し、因果アテンションメカニズムとKVキャッシュ技術を組み合わせることで、EasyControlはモデルの互換性を大幅に向上させ、プラグアンドプレイ機能とロスレススタイル制御をサポートします。また、生成の柔軟性を高め、複数の解像度、アスペクト比、複数条件の組み合わせをサポートします。さらに、推論効率を最適化し、実行時のモデル効率を向上させます。

このチュートリアルでは、様式化された Img2Img コントロール モデルを使用します。このモデルは、顔の特徴を維持し、象徴的なアニメの美学を適用しながら、肖像画を宮崎駿風のアートワークに変換できます。このモデルは、実際のアジア人の顔 100 個と、それに対応する GPT-4o で生成されたジブリ風の画像のみを使用してトレーニングされています。さらに、EasyControl は CFG-Zero チームと協力して、画像の忠実度と制御性をさらに向上させました。チームは、モデルのパフォーマンスを最適化し、より多くのアプリケーションシナリオを探索し続ける予定です。将来的には、コミュニティのさらなる研究開発をサポートするために、より多くの事前トレーニング済みの重みとトレーニング コードがリリースされる可能性があります。

このチュートリアルでは、EasyControl をデモンストレーションとして使用し、コンピューティング リソースには A6000 を使用します。

2. 操作手順

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

「BadGateway」が表示されている場合は、モデルが初期化中であることを意味します。モデルが大きいため、1〜2分ほど待ってページを更新してください。

2. ウェブサイトにアクセスしたら、使用を開始できます。

利用手順

デモ

交流とディスカッション

🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。 

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています