HyperAI超神経

Chain-of-Zoom: 超解像画像の詳細拡大デモ

1. チュートリアルの概要

建てる

Chain-of-Zoomは、KAIST AI研究チームによって2025年5月26日にリリースされたChained Zoom(COZ)フレームワークです。このフレームワークは、従来の単一画像超解像(SISR)モデルでは、その範囲をはるかに超えるズームが必要な場合に失敗するという問題を解決します。COZフレームワークに組み込まれた標準的な4倍拡散SRモデルは、高い知覚品質と忠実度を維持しながら、256倍以上のズームを実現できます。関連論文の結果は以下です。Chain-of-Zoom: スケール自己回帰と選好アライメントによる超解像”。

このチュートリアルで使用されるコンピューティング リソースは、デュアル カード RTX 4090 です。

2. エフェクト表示

3. 操作手順

1. コンテナを起動します

2. 使用手順

「Bad Gateway」と表示される場合、モデルが初期化中であることを意味します。モデルが大きいため、2〜3分ほど待ってページを更新してください。

具体的なパラメータ:

  • 入力画像: 入力画像。
  • 色合わせ方法:
    • ウェーブレット: 色補正は実行されません。
    • adain: 適応インスタンス正規化による色補正。
    • nofix: より細かい色補正を行うためにウェーブレット変換を使用します。

結果 

4. 議論

🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。

引用情報

Githubユーザーに感謝 スーパーヤン  このチュートリアルの展開。このプロジェクトの引用情報は次のとおりです。

@article{kim2025chain,
  title={Chain-of-Zoom: Extreme Super-Resolution via Scale Autoregression and Preference Alignment},
  author={Kim, Bryan Sangwoo and Kim, Jeongsol and Ye, Jong Chul},
  journal={arXiv preprint arXiv:2505.18600},
  year={2025}
}