オンラインチュートリアル:Qwen-Image が画像編集の現状を刷新し、正確な中国語レンダリングを実現

最近、Ali Tongyi Qianwen チームは、最初の基本的な画像生成モデル Qwen-Image をオープンソース化しました。パラメータ数は20Bに達し、画像生成モデルのSOTAを刷新する新しいMMDiTアーキテクチャを採用しています。

Qwen-Image は、複雑なテキスト レンダリングと正確な画像編集という 2 つの主要なシナリオにおける AI 機能の向上に重点を置いています。ポスターのスローガン、PPTの長い段落、古書の詩情など、Qwen-Imageは優れたレンダリング能力、優れたフォント形状、タイプセッティング、セマンティクスにより、中国語と英語の両方で正確に表現できます。テキストレンダリングは複数の評価リストでSOTAを獲得しています。特に注目すべきは、Qwen-Imageの中国語レンダリングにおける強力なパフォーマンスが、オープンソースビジュアルモデルの中国語機能構築を強力に補完し、中国語をビジュアルモデルレンダリングシステムにさらに自然に組み込むことを可能にすることです。単語単位のレンダリングの精度は 58.3% に達し、正確な中国語出力を必要とするアプリケーション シナリオに信頼できる選択肢を提供します。
画像編集に関しては、Qwen-Image は強力な多次元機能を提供します。スタイルの転送、追加、削除、変更などの基本的な操作をサポートするだけでなく、ローカルの変更やキャラクターの姿勢調整などの詳細な機能も可能にします。Qwen-Imageを使えば、一般ユーザーでもプロレベルの画像編集結果を簡単に実現できます。チェーン編集は、モデルに強力な「メモリアンカー」機能を提供し、複数回の修正後も被写体IDの一貫性を維持するため、「編集に次ぐ編集、変更に次ぐ変更」という煩わしさから解放されます。
Qwen-Image: 高度なテキストレンダリング機能を備えた画像モデルHyperAI公式サイト(hyper.ai)の「チュートリアル」セクションで公開中です。今すぐ導入して、プロフェッショナルな結果を簡単に手に入れましょう!
チュートリアルのリンク:
デモの実行
1. hyper.ai ホームページで「チュートリアル」ページを選択し、「Qwen-Image: 高度なテキスト レンダリングを備えたイメージ モデル」を選択して、「このチュートリアルをオンラインで実行」をクリックします。


2. ページがジャンプしたら、右上隅の「クローン」をクリックしてチュートリアルを独自のコンテナにクローンします。

3. NVIDIA RTX A6000 48GBとPyTorchイメージを選択し、ニーズに合わせて従量課金制または日次/週次/月次プランを選択し、「続行」をクリックします。新規ユーザーは、以下の招待リンクから登録すると、RTX 4090を4時間分、CPU時間を5時間分無料でご利用いただけます。
HyperAI ハイパーニューラルの専用招待リンク (ブラウザに直接コピーして開きます):
https://openbayes.com/console/signup?r=Ada0322_NR0n


4. リソースが割り当てられるまでお待ちください。最初のクローン作成プロセスには約3分かかります。ステータスが「実行中」に変わったら、「APIアドレス」の横にある矢印をクリックしてデモページに移動します。APIアドレスを使用する前に、実名認証を完了する必要がありますのでご注意ください。

効果実証
実行ページに入ったら、入力ボックスに「Prompt」と入力してください。「詳細設定」オプションでは、詳細なパラメータを設定して実行できます。実際に試してみたところ、Qwen-Imageのテキストレンダリング機能は実に強力で、正確なフォント形状と美しい書体を安定して実現できました。

プロンプト:アニメ調の少女。繊細なアニメフェイス、キラキラ輝く瞳、ピンクのロングヘア、そして白いリボン。彼女は光る羊皮紙を手に持ち、そこには「Qwen-Imageモデルオープンソース、複雑なテキストレンダリングと精密な画像編集における大きな進歩」というメッセージが丁寧に手書きされている。魔法学校の制服を着用し、背景には星空が広がる書斎があり、魔法の本が浮かび、パーティクルライティングのエフェクトが施されている。アートワークはジブリ風で、ソフトライトフィルターと被写界深度ブラーが施されている。

プロンプト:このポスターは、モランディカラーパレットの柔らかなグラデーション背景を特徴とするグラフィックデザインです。グレーがかったピンクのベースカラーに、ヘイズピンクとオートミールホワイトのトランジションが重ねられています。コアテキストは中央に配置されています。「Qwen-Image:高度なテキストレンダリング機能を備えた画像モデル」は、HyperAI公式サイト(hyper.ai)の「チュートリアル」セクションで公開されています。今すぐ導入して、プロフェッショナルな成果を体験しましょう!装飾要素には、原色パレットから伸びる抽象的な幾何学的な線が用いられています。漫画風のアニメロボットが背景と並置され、繊細な光の粒子とシワのある紙の質感を引き立てています。テキストのエッジはシャープで、ギザギザがありません。
以上が今回HyperAIがおすすめするチュートリアルです。ぜひ皆さんも体験してみてください!
チュートリアルのリンク: