HyperAI超神経
17日前

書道家:フリースタイルテキストイメージのカスタマイズ

Yue Ma, Qingyan Bai, Hao Ouyang, Ka Leong Cheng, Qiuyu Wang, Hongyu Liu, Zichen Liu, Haofan Wang, Jingye Chen, Yujun Shen, Qifeng Chen
書道家:フリースタイルテキストイメージのカスタマイズ
要約

私たちは、デジタル書道やデザインアプリケーション向けに、先進的なテキストカスタマイズと芸術的なタイポグラフィを革新的に統合した新しい拡散型フレームワーク「カリグラファー(Calligrapher)」を紹介します。このフレームワークは、タイポグラフィのカスタマイズにおけるスタイル制御の精度とデータ依存性の課題に対処するために、3つの主要な技術的貢献を取り入れています。まず、事前学習済みのテキストから画像生成モデルと大規模言語モデルを活用し、自動的にスタイル中心のタイポグラフィベンチマークを構築する自己蒸留メカニズムを開発しました。次に、Qformerと線形層から構成される学習可能なスタイルエンコーダーを用いた局所的なスタイル注入フレームワークを導入しました。これにより、参照画像から堅牢なスタイル特徴を抽出することが可能になります。さらに、コンテキスト内生成メカニズムも採用しており、参照画像を直接デノイジングプロセスに埋め込むことで、目標スタイルとの洗練された整合性がより一層向上します。多様なフォントやデザインコンテキストにおける広範な定量的および定性的評価により、「カリグラファー」が複雑なスタイリッシュな詳細と正確なグリフ配置を再現できることを確認しています。高品質で視覚的に一貫性のあるタイポグラフィの自動化によって、「カリグラファー」は従来のモデルを超えており、デジタルアート、ブランド化、コンテキストに基づくタイポグラフィデザインなどの分野でクリエイティブ実践者たちを支援します。