HyperAIHyperAI

Command Palette

Search for a command to run...

OmniConsistency: GPT-4oレベルの文字スタイル転送モデル

Date

8ヶ月前

Size

327.71 MB

License

MIT

Paper URL

2505.18445

1. チュートリアルの概要

GitHubスター

シンガポール国立大学のShow Labが2025年5月28日にリリースしたOmniConsistencyは、拡散変換に基づく汎用的な一貫性向上プラグインです。OmniConsistencyは、視覚的な一貫性と美的品質を大幅に向上させ、最先端の商用モデルGPT-4oに匹敵する性能を実現します。オープンソースモデルと商用モデル(GPT-4oなど)間のスタイル一貫性における性能格差を埋め、AI作成のための低コストで制御性の高いソリューションを提供し、画像生成技術の民主化を促進します。互換性とプラグアンドプレイ機能により、開発者やクリエイターの参入障壁も低減します。関連研究論文も公開されています。 OmniConsistency: ペアの様式化データからスタイルに依存しない一貫性を学習する

このチュートリアルで使用されるコンピューティング リソースは、単一の RTX A6000 カードです。

2. エフェクト表示

3. 操作手順

1. コンテナを起動します

「Bad Gateway」と表示される場合、モデルが初期化中であることを意味します。モデルが大きいため、2〜3分ほど待ってページを更新してください。

2. 使用例

Web ページに入ると、モデルを操作できるようになります。

カスタムLoRAをご利用の場合、モデルをオンラインでダウンロードする必要があるため、生成に時間がかかります。しばらくお待ちください。また、モデルのダウンロード中にネットワークの問題が発生すると、ダウンロードに失敗する可能性があります。コンテナを再起動して、モデルを再度ダウンロードすることをお勧めします。

結果を生成する

4. 議論

🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。

引用情報

Githubユーザーに感謝 スーパーヤン  このチュートリアルの展開。このプロジェクトの引用情報は次のとおりです。

@inproceedings{Song2025OmniConsistencyLS,
  title={OmniConsistency: Learning Style-Agnostic Consistency from Paired Stylization Data},
  author={Yiren Song and Cheng Liu and Mike Zheng Shou},
  year={2025},
  url={https://api.semanticscholar.org/CorpusID:278905729}
}

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています