Command Palette
Search for a command to run...
JarvisArt-プレビュー スマート写真レタッチプロキシ
1. チュートリアルの概要

JarvisArt-Previewは、厦門大学、香港科技大学(広州)、清華大学などの研究機関によって2025年6月24日にリリースされたインテリジェントな写真レタッチプロキシモデルです。Artistic Retouch Benchmarkにおいて、本モデルはAdobe Firefly Retouchに対し、「命令マッチング精度」と「プロフェッショナルレタッチ効果」のカテゴリーでそれぞれ68.3%と61.5%の勝率を達成しました。また、Style Transfer Evaluation SuiteやHuman Preference Testといった従来の画像編集ベンチマークにおいても、最先端の性能を達成しました。さらに、このモデルは、Lightroom 200以上のツールを自然言語でエンドツーエンドに呼び出し、クロススタイル要素のインテリジェントな融合(油絵とスケッチなどの混合スタイルをサポート)、レタッチ手順の解釈可能なバックトラッキング(各手順の自然言語による説明を生成)、テキストと画像間の双方向反復最適化(生成された結果に基づいて指示の逸脱を自動的に修正)など、従来のシステムでは稀にしか見られなかった機能を備えています。関連研究論文も入手可能です。 JarvisArt: インテリジェントな写真レタッチエージェントによる人間の芸術的創造性の解放NeurIPS 2025 に収録されました。
このチュートリアルでは、RTX 4090 グラフィックカードを1枚使用します。サポートされる言語は英語のみです。
2. プロジェクト例

3. 操作手順
1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

2. 使用手順
「Bad Gateway」と表示される場合は、モデルが初期化中であることを意味します。モデルのサイズが大きいため、2~3分ほどお待ちいただいてからページを更新してください。生成されたファイルを表示するには、LightRoomをご利用ください。

パラメータの説明
- 高度な生成パラメータ:
- 最大新規トークン数: モデルが画像編集関連のテキスト(操作手順、手順の説明など)に対して生成できるトークンの最大数を制限します。値が大きいほど、生成される画像編集ロジックの説明や手順は詳細になり、出力コンテンツが長くなります。
- 温度:画像レタッチ戦略のランダム性を制御します。値が低いほど(例:0.1に近いほど)、出力されるレタッチアイデアは安定し、予測可能性が高まります。値が高いほど(例:2に近いほど)、レタッチアイデアはより多様で多様なものになりますが、予期しない調整ロジックが現れる場合があります。
- Top-K: 各生成ステップにおいて、最も確率の高いK個のタグからコンテンツのみが選択されます。値が小さいほど(例:10)、生成されるレタッチ指示はより焦点が絞られ、より保守的になります。値が大きいほど(例:100)、指示の選択はより多様になり、より多くの潜在的なレタッチアイデアが利用可能になります。
- Top-P(Nucleus Sampling):累積確率閾値を用いて出力の多様性を制御します。値が低いほど(例:0.5)、画像編集ロジックはより集中的になり、少数の高確率マーカーのみからサンプリングされます。値が高いほど(例:0.9)、低確率ながらもクリエイティブなマーカーの参加が増えるため、結果の多様性が向上します。
- 保守的 / 創造的 / バランス: パラメータの組み合わせを素早く切り替えるためのショートカット
- 「保守的」モードでは、安定した予測可能な画像レタッチ戦略が生成される傾向があります。
- 「クリエイティブ」モードでは、多様で多様な写真編集の創造性を重視します。
- 「バランス」モードは、安定性と創造性のバランスを実現します。
引用情報
このプロジェクトの引用情報は次のとおりです。
@article{jarvisart2025,
title={JarvisArt: Liberating Human Artistic Creativity via an Intelligent Photo Retouching Agent},
author={Yunlong Lin and Zixu Lin and Kunjie Lin and Jinbin Bai and Panwang Pan and Chenxin Li and Haoyu Chen and Zhongdao Wang and Xinghao Ding and Wenbo Li and Shuicheng Yan},
year={2025},
journal={arXiv preprint arXiv:2506.17612}
}