
要約
本研究では、コンポジション規則の明示的モデリングが画像クロッピングに有益であることを示す。画像クロッピングは、プロフェッショナルな写真撮影における美的構図の自動化を実現する有望な手法とされている。しかし、従来の手法はこのような専門的知識を間接的にのみモデル化しており、例えば比較候補からの順位付けによって実現されているにとどまっている。自然な構図の特徴が常に特定の規則に従うという観察に基づき、本研究ではその規則を判別的に学習し、さらに重要なのは、学習された構図の手がかりをモデルに明示的に組み込むことにある。そのため、コンポジション規則を符号化する「キーコンポジションマップ(KCM)」という概念を導入する。KCMは、異なる構図規則の背後にある共通的な法則を明らかにでき、クロッピングモデルに構図において何が重要であるかを示すことができる。KCMを活用して、新たな「構図に基づくクロッピング(cropping-by-composition)」の枠組みを提案し、構図に配慮した画像クロッピングを実現するネットワークを構築した。2つのベンチマークに対する広範な実験により、本手法が効果的で解釈可能かつ高速な画像クロッピングを可能にすることが実証された。