HyperAI超神経

サナ高解像度画像合成

GitHub-Sana
星
arXiv論文
ライセンス

1. チュートリアルの概要

Sana は 2025 年 1 月にリリースされ、NVIDIA、MIT、清華大学が共同で主導しています。 Sana は、最大 4096 × 4096 解像度の画像を効率的に生成できるテキストから画像に変換するフレームワークです。 Sana は、強力なテキストと画像の位置合わせ機能を備え、高解像度、高品質の画像を非常に高速に合成できます。関連する論文の結果は以下の通りである。SANA: 線形拡散変換器を用いた効率的な高解像度画像合成」という論文がICLR 2025に採択されました。

このチュートリアルでは、デモンストレーションに Sana_1600M_1024px モデルを使用し、コンピューティング パワー リソースには単一のカード 4090 を使用します。

2. 操作手順

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

「Bad Gateway」と表示される場合は、モデルが初期化中であることを意味します。 1~2分ほど待ってからページを更新してください。

2. 使用デモ

引用情報

Githubユーザーに感謝 スーパーヤン  このチュートリアルの展開では、プロジェクト参照情報は次のとおりです。

@misc{Sana2025,
  title={Sana: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformer},
  author={Enze Xie, Junsong Chen, Junyu Chen, Han Cai, Haotian Tang, Yujun Lin, Zhekai Zhang, Muyang Li, Ligeng Zhu, Yao Lu, Song Han},
  howpublished={\url{https://nvlabs.github.io/Sana/}},
  note={GitHub Repository with Code, Model & Documentation},
  year={2025}
}

議論

🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。