17日前

Few Shot Part Segmentation が産業用異常検出の構成論的論理を明らかにする

Soopil Kim, Sion An, Philip Chikontwe, Myeongkyun Kang, Ehsan Adeli, Kilian M. Pohl, Sang Hyun Park

要約

論理的異常（Logical Anomalies, LA）とは、画像内の部品の数量、配置、構成など、内在する論理的制約に違反するデータを指す。こうした異常を正確に検出するには、セグメンテーションを通じて複数の部品種類について推論するモデルが必要となる。しかし、セマンティックセグメンテーションに必要なピクセル単位のラベル付けは、時間とコストが非常にかかる。これまでに少数のラベル付きサンプルを用いる少サンプルまたは非教師ありの共部品セグメンテーション手法が提案されてきたが、工業用オブジェクトを含む画像ではその性能が著しく低下する傾向がある。これは、同様のテクスチャや形状を持つ部品が多数存在し、精確な区別が困難であるためである。本研究では、論理的制約を共有する少数のラベル付きサンプルと未ラベル画像を活用する新しい部品セグメンテーションモデルを提案する。未ラベル画像間での一貫性のあるセグメンテーションを確保するために、ヒストグラムマッチング損失とエントロピー損失を併用する。セグメンテーション予測は検出性能に重要な役割を果たすため、クラスヒストグラム、部品構成埋め込み、ピッチレベル表現の3つのメモリバンクを用いて、視覚的意味から重要な特徴を捉え、局所的およびグローバルなサンプル妥当性検出を強化する。効果的なLA検出を実現するため、推論時に異なるメモリバンクから得られる異常スコアを適応的にスケーリングする戦略を提案する。公開ベンチマークMVTec LOCO ADにおける広範な実験の結果、本手法はLA検出において98.1%のAUROCを達成し、競合手法の89.6%を上回った。