日付

6ヶ月前

サイズ

372.42 MB

タグ

画像生成

テキストから画像生成

ライセンス

Apache 2.0

GitHub

QwenLM/Qwen-Image

論文URL

2508.02324

1. チュートリアルの概要

Qwen-Imageは、アリババのTongyi Qianwenチームによって2025年8月にリリースされた高品質の画像生成・編集モデルです。このモデルは、テキストレンダリングにおいて画期的な進歩を遂げ、中国語と英語の両方で複数行の段落を高忠実度で出力できるほか、複雑なシーンやミリメートルレベルの詳細を正確に再現する機能を備えています。マルチタスク協調トレーニングパラダイムを通じて、Qwen-Imageは画像編集においてピクセルレベルの一貫性を実現し、プロセス全体を通して被写体、照明、テクスチャのドリフトをゼロに抑えます。ワンクリックで、リアル、アニメ、サイバーパンク、SF、ミニマリスト、レトロ、シュール、水墨画など、数十種類のスタイルを生成でき、スタイルの転送、要素の追加と削除、ディテールの強調、テキストの再描画、ポーズのリセットなど、フルディメンションのきめ細かな操作をサポートしています。関連する研究論文も入手可能です。 Qwen-Image 技術レポート。

このチュートリアルでは、デュアルカード RTX A6000 リソースを使用します。

2. プロジェクト例

3. 操作手順

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

2. 使用手順

「Bad Gateway」と表示される場合、モデルが初期化中であることを意味します。モデルが大きいため、2〜3分ほど待ってページを更新してください。

パラメータの説明

詳細設定:
- 否定プロンプト: 否定プロンプト語は、画像に表示したくないコンテンツまたはスタイルを指定するために使用されます。
- シード: ランダムシード。
- シードのランダム化: シードを自動的にランダム化するかどうか。
- 画像サイズ (比率): 出力画像の解像度比率を制御します。
- ガイダンススケール: 生成される画像の品質を制御するために使用されるガイダンススケール。
- 推論ステップ数: 生成される画像の詳細レベルを制御するために使用される推論ステップの数。

4. 議論

🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。

引用情報

このプロジェクトの引用情報は次のとおりです。

@article{qwen-image,
    title={Qwen-Image Technical Report}, 
    author={Qwen Team},
    journal={arXiv preprint},
    year={2025}
}

このノートブックはコミュニティユーザーによって提供されたものであり、教育および情報提供のみを目的としています。コンテンツに著作権侵害が含まれる場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このNotebookを実行 Discordで議論

日付

6ヶ月前

サイズ

372.42 MB

タグ

画像生成

テキストから画像生成

ライセンス

Apache 2.0

GitHub

QwenLM/Qwen-Image

論文URL

2508.02324

1. チュートリアルの概要

このチュートリアルでは、デュアルカード RTX A6000 リソースを使用します。

2. プロジェクト例

3. 操作手順

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

2. 使用手順

「Bad Gateway」と表示される場合、モデルが初期化中であることを意味します。モデルが大きいため、2〜3分ほど待ってページを更新してください。

パラメータの説明

詳細設定:
- 否定プロンプト: 否定プロンプト語は、画像に表示したくないコンテンツまたはスタイルを指定するために使用されます。
- シード: ランダムシード。
- シードのランダム化: シードを自動的にランダム化するかどうか。
- 画像サイズ (比率): 出力画像の解像度比率を制御します。
- ガイダンススケール: 生成される画像の品質を制御するために使用されるガイダンススケール。
- 推論ステップ数: 生成される画像の詳細レベルを制御するために使用される推論ステップの数。

4. 議論

引用情報

このプロジェクトの引用情報は次のとおりです。

@article{qwen-image,
    title={Qwen-Image Technical Report}, 
    author={Qwen Team},
    journal={arXiv preprint},
    year={2025}
}

Qwen-Image-Lightningのワンクリック展開

2ヶ月前

LongCat-Video: MeituanのオープンソースAIビデオ生成モデル

3ヶ月前

Ovis-Image: 高品質画像生成モデル

2ヶ月前

LongCat-Image: バイリンガルテキスト駆動型画像生成システム

2ヶ月前

Qwen-Image-2512: よりリアルな肖像画と自然風景の生成

1ヶ月前

vLLM-Omniを使用してQwen-Image-2512をデプロイする

6日前

Qwen Image Layered Interfaceは複数のレイヤーを自動的に分割します

2ヶ月前

vLLM-Omniを使用したQwen-Image-Editの導入

6日前

Z-Image-Turbo: 高効率6Bパラメータ画像生成モデル

2ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Command Palette

Qwen-Image: 高度なテキストレンダリング機能を備えた画像モデル

1. チュートリアルの概要

2. プロジェクト例

3. 操作手順

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

2. 使用手順

4. 議論

引用情報

AIでAIを構築

HyperAI Newsletters

Command Palette

Qwen-Image: 高度なテキストレンダリング機能を備えた画像モデル

1. チュートリアルの概要

2. プロジェクト例

3. 操作手順

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

2. 使用手順

4. 議論

引用情報

関連 ノートブック

Qwen-Image-Lightningのワンクリック展開

LongCat-Video: MeituanのオープンソースAIビデオ生成モデル

Ovis-Image: 高品質画像生成モデル

LongCat-Image: バイリンガルテキスト駆動型画像生成システム

Qwen-Image-2512: よりリアルな肖像画と自然風景の生成

vLLM-Omniを使用してQwen-Image-2512をデプロイする

Qwen Image Layered Interfaceは複数のレイヤーを自動的に分割します

vLLM-Omniを使用したQwen-Image-Editの導入

Z-Image-Turbo: 高効率6Bパラメータ画像生成モデル

AIでAIを構築

HyperAI Newsletters

Command Palette

Qwen-Image: 高度なテキストレンダリング機能を備えた画像モデル

1. チュートリアルの概要

2. プロジェクト例

3. 操作手順

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

2. 使用手順

4. 議論

引用情報

関連 ノートブック

Qwen-Image-Lightningのワンクリック展開

LongCat-Video: MeituanのオープンソースAIビデオ生成モデル

Ovis-Image: 高品質画像生成モデル

LongCat-Image: バイリンガルテキスト駆動型画像生成システム

Qwen-Image-2512: よりリアルな肖像画と自然風景の生成

vLLM-Omniを使用してQwen-Image-2512をデプロイする

Qwen Image Layered Interfaceは複数のレイヤーを自動的に分割します

vLLM-Omniを使用したQwen-Image-Editの導入

Z-Image-Turbo: 高効率6Bパラメータ画像生成モデル

AIでAIを構築

HyperAI Newsletters

関連 ノートブック

Qwen-Image-Lightningのワンクリック展開

LongCat-Video: MeituanのオープンソースAIビデオ生成モデル

Ovis-Image: 高品質画像生成モデル

LongCat-Image: バイリンガルテキスト駆動型画像生成システム

Qwen-Image-2512: よりリアルな肖像画と自然風景の生成

vLLM-Omniを使用してQwen-Image-2512をデプロイする

Qwen Image Layered Interfaceは複数のレイヤーを自動的に分割します

vLLM-Omniを使用したQwen-Image-Editの導入

Z-Image-Turbo: 高効率6Bパラメータ画像生成モデル

関連 ノートブック

Qwen-Image-Lightningのワンクリック展開

LongCat-Video: MeituanのオープンソースAIビデオ生成モデル

Ovis-Image: 高品質画像生成モデル

LongCat-Image: バイリンガルテキスト駆動型画像生成システム

Qwen-Image-2512: よりリアルな肖像画と自然風景の生成

vLLM-Omniを使用してQwen-Image-2512をデプロイする

Qwen Image Layered Interfaceは複数のレイヤーを自動的に分割します

vLLM-Omniを使用したQwen-Image-Editの導入

Z-Image-Turbo: 高効率6Bパラメータ画像生成モデル

関連ノートブック

関連ノートブック

関連ノートブック

関連ノートブック