7日前
StyleShot: 任意のスタイルのスナップショット
Junyao Gao, Yanchen Liu, Yanan Sun, Yinhao Tang, Yanhong Zeng, Kai Chen, Cairong Zhao

要約
本稿では、テスト時チューニングを伴わずしても、一般化されたスタイル転送を実現するためには、優れたスタイル表現が極めて重要かつ十分であることを示す。この目的を達成するために、スタイルに敏感なエンコーダーと、名付けて「StyleGallery」という体系的かつ整然としたスタイルデータセットを構築した。スタイル学習に特化した設計により、このスタイルに敏感なエンコーダーは、分離学習戦略を用いて表現力豊かなスタイル表現を抽出するよう訓練され、StyleGalleryはモデルの一般化能力を高める役割を果たす。さらに、コンテンツ融合エンコーダーを導入することで、画像駆動型スタイル転送の性能を向上させた。本研究で提案する手法、StyleShotは、テスト時チューニングなしで、3D風、フラットなスタイル、抽象的スタイル、さらには細粒度なスタイルなど、多様な望ましいスタイルを効果的に再現できることを強調する。厳密な実験により、既存の最先端手法と比較して、幅広いスタイルにおいて優れた性能を達成することが確認された。プロジェクトページは以下の通り:https://styleshot.github.io/。