
要約
画像異常検出およびセグメンテーションにおいて著しい進歩が見られますが、3D情報を活用する手法は少ないです。本研究では、最近導入された3D異常検出データセットを用いて、3D情報の利用が見逃されている機会であるかどうかを評価します。まず、驚くべき結果を提示します:標準的な色のみを使用する手法が、3D情報を明示的に活用するすべての現行手法を上回っています。これは直感に反するもので、データセットの単純な検査でも明らかですが、色のみの手法では幾何学的な異常を含む画像に対して不十分であることがわかります。この結果は、「異常検出手法がどのようにして3D情報を効果的に活用できるのか」という問いを提起します。私たちは手作りと深層学習に基づいた形状表現の範囲を調査し、その中で回転不変性が性能に最も重要な役割を果たすことを示しました。また、深層学習や外部事前学習データセット、色情報を使わずに最近のアプローチ全てを上回る単純な3Dのみの手法を見つけました。ただし、3Dのみの手法では色やテクスチャの異常を検出できないため、これを色ベースの特徴量と組み合わせることで大幅に性能向上を達成しました。私たちの提案する方法「BTF(Back to the Feature)」は、MVTec 3D-ADデータセット上でピクセル単位でのROCAUC:99.3%およびPRO:96.4%という優れた成績を記録しています。