
要約
近年、機械学習における識別可能な情報が引き起こすプライバシー問題についての懸念が高まっている。しかし、これまでのポートレートマッティング手法はすべて、識別可能な画像に基づいていた。このギャップを埋めるために、本研究ではプライバシー保護型ポートレートマッティング(P3M)のための初めての大規模な匿名化ベンチマークであるP3M-10kを提案する。P3M-10kは、高解像度の顔領域がぼかされたポートレート画像10,421枚と、高品質なアルファマットを含んでおり、トリマップ不要およびトリマップベースのマッティング手法を体系的に評価できる環境を提供する。さらに、プライバシー保護学習(PPT)設定下におけるモデルの一般化能力に関する有用な知見を得ることも可能となった。また、CNNとTransformerの両方のバックボーンと互換性を持つ統一型マッティングモデルであるP3M-Netを提案する。PPT設定下におけるドメイン間性能ギャップをさらに軽減するため、公開の有名人画像から顔情報を借用し、データレベルおよび特徴レベルの両方でネットワークに顔の文脈を再習得させる、シンプルかつ効果的な「コピー&ペースト戦略」(P3M-CP)を設計した。P3M-10kおよび公開ベンチマーク上での広範な実験により、P3M-Netが最先端手法を上回る性能を示し、P3M-CPがドメイン間一般化能力を向上させる有効性が確認された。これらは、今後の研究および実世界応用においてP3Mが持つ極めて重要な意義を示唆している。