オンラインチュートリアル | シンガポール国立大学ショーラボが、プラグアンドプレイの画像スタイル転送を実現するOmniConsistencyモデルをリリース

特色图像

画像様式化は、様式化されたモデルを用いて、画像の意味内容を変えずに、あるスタイルから別のスタイルに変換することを目的としています。近年、拡散モデルの登場により、主流の画像様式化手法はディープニューラルネットワークから低ランク適応(LoRA)によって微調整された手法へと移行し、画像一貫性モジュールと組み合わせることで、様式化の品質が大幅に向上しました。

画像様式化モデルは市場から良いフィードバックを得ているが、しかし、現在の画像スタイル設定方法には、依然として次の 3 つの重要な課題が残っています。まず、様式化された出力と入力の一貫性が限られています。既存のモジュールは全体的な構造の整合を保証できますが、複雑なシーンの詳細と意味情報を保持することが困難です。2 番目に、画像間のシナリオでスタイルが劣化する問題があります。この設定での LoRA と IPAdapter のスタイル忠実度は、通常、テキスト生成画像よりも低くなります。3 番目に、レイアウト制御の柔軟性が十分ではありません。厳格な条件 (エッジ、スケッチ、姿勢など) に依存する方法では、Q バージョン変換などの創造的な構造変更をサポートすることが困難です。

このギャップを埋めるために、2025 年 5 月 28 日、シンガポール国立大学の Show Lab は、大規模拡散トランスフォーマー (DiT) を使用するユニバーサル整合性プラグインである OmniConsistency をリリースしました。これは完全にプラグアンドプレイの設計であり、Flux フレームワークの下にあるあらゆるスタイルの LoRA と互換性があり、堅牢な一般化を実現するために様式化された画像ペアの一貫性学習メカニズムに基づいています。

実験により、OmniConsistency により視覚的な一貫性と美的品質が大幅に向上することが示されています。GPT-4o に匹敵するパフォーマンスを実現し、スタイルの一貫性という点でオープンソース モデルと商用モデル間のパフォーマンス ギャップを埋めます。AI開発のための低コストで制御性の高いソリューションを提供します。さらに、互換性とプラグアンドプレイ機能により、開発者やクリエイターにとって導入のハードルが低くなります。

現在のところ、HyperAI 公式サイトの「チュートリアル」セクションに「OmniConsistency: GPT-4o レベルの文字スタイル転送モデル」が公開されました。ワンクリックデプロイチュートリアルを体験するには、以下のリンクをクリックしてください⬇️

* チュートリアルアドレス:https://go.hyper.ai/3mCyv

新規登録ユーザーの皆様には、サプライズ特典をご用意いたしました。招待コード「OmniConsistency」を使用してOpenBayesプラットフォームにご登録いただくと、RTX A6000を4時間無料でご利用いただけます(リソースの有効期限は1ヶ月です)。数量限定のため、先着順となります。

デモの実行

1. hyper.ai ホームページにアクセス後、「チュートリアル」ページを選択し、「OmniConsistency: GPT-4o レベルの文字スタイル転送モデル」を選択して、「このチュートリアルをオンラインで実行」をクリックします。

2. ページがジャンプしたら、右上隅の「クローン」をクリックしてチュートリアルを独自のコンテナにクローンします。

3. 「NVIDIA RTX A6000 48GB」と「PyTorch」イメージを選択します。OpenBayesプラットフォームでは4つの課金方法をご用意しています。ニーズに合わせて「Pay as you go」または「Daily/Weekly/Monthly」からお選びいただけます。「Continue」をクリックしてください。新規ユーザーは、以下の招待リンクから登録すると、RTX 4090 4時間分とCPUフリータイム5時間分がプレゼントされます。

HyperAI ハイパーニューラルの専用招待リンク (ブラウザに直接コピーして開きます):

https://openbayes.com/console/signup?r=Ada0322_NR0n

4. リソースが割り当てられるのを待ちます。最初のクローン作成プロセスには約 2 分かかります。ステータスが「実行中」に変わったら、「API アドレス」の横にあるジャンプ矢印をクリックしてデモ ページに移動します。モデルが大きいため、WebUI インターフェイスが表示されるまでに約 3 分かかります。そうでない場合は、「Bad Gateway」と表示されます。 APIアドレスアクセス機能を使用する前に、ユーザーは実名認証を完了する必要がありますのでご注意ください。

効果実証

ポートレート写真をアップロードし、「内蔵LoRAを選択」パラメータをLEGOに設定しました。効果は下の図の通りです~