
要約
顔アライメントはコンピュータビジョン分野において重要なトピックである。近年の数十年にわたり、多くの研究努力がなされ、さまざまなベンチマークデータセットが公開されてきた。しかし、最近のデータセットには依然として2つの重要な問題が残っている。すなわち、データセット内変動(Intra-Dataset Variation)とデータセット間変動(Inter-Dataset Variation)である。データセット間変動とは、特定のデータセット内における表情や頭部ポーズなどのバイアスを指すのに対し、データセット内変動とは、異なるデータセット間で生じるバイアスの違いを意味する。これらの問題に対処するために、本研究では、2つの強力に結合されたサブネットワーク、すなわちデータセット跨ぐネットワーク(DA-Net)と候補決定ネットワーク(CD-Net)から構成される、新しい深層変動活用ネットワーク(Deep Variation Leveraging Network: DVLN)を提案する。広範な評価結果から、本手法がリアルタイム性能を達成し、挑戦的な300-Wデータセットにおいて最先端手法を大きく上回ることを示した。