
要約
埋め込み手法は、潜在的な意味空間で顔の特徴を比較することで顔認識において成功を収めてきました。しかし、完全に制約のない環境での顔認識では、埋め込みモデルが学習した顔の特徴が曖昧であるか、あるいは入力された顔画像に存在しない可能性があり、これにより雑音のある表現が生じることがあります。本研究では、各顔画像を潜在空間におけるガウス分布として表現する確率的顔埋め込み(Probabilistic Face Embeddings, PFEs)を提案します。この分布の平均値は最も尤もらしい特徴量を推定し、分散は特徴量の不確実性を示します。不確実性情報を用いてPFEsのマッチングと融合を行うことで、確率的な解決策が自然に導き出されます。異なる基線モデル、訓練データセット、ベンチマークに対する経験的評価により、提案手法が確定的な埋め込みをPFEsに変換することで顔認識性能を向上させることを示しています。PFEsによって推定される不確実性は、潜在的なマッチング精度の良い指標となり、リスク管理型認識システムにおいて重要です。