17日前

PAD:ポーズに依存しない異常検出のためのデータセットおよびベンチマーク

Qiang Zhou, Weize Li, Lihan Jiang, Guoliang Wang, Guyue Zhou, Shanghang Zhang, Hao Zhao
PAD:ポーズに依存しない異常検出のためのデータセットおよびベンチマーク
要約

オブジェクト異常検出は機械視覚分野における重要な課題であり、近年顕著な進展が見られている。しかし、その研究および応用を阻害する二つの主要な課題が存在する。第一に、既存のデータセットは多様な姿勢角度からの包括的な視覚情報を欠いている。多くの場合、正常な訓練データが姿勢整合(pose-aligned)であるという現実的でない仮定がなされており、テストサンプルも訓練データと同じ姿勢を持つと仮定している。しかし実際には、異常はオブジェクトの任意の領域に存在しうるため、訓練サンプルとクエリサンプルの姿勢が異なる場合も少なくない。このため、「姿勢に依存しない異常検出(pose-agnostic anomaly detection)」の研究が不可欠である。第二に、姿勢に依存しない異常検出に関する実験プロトコルの共通基準が存在しないため、異なる手法間での公平な比較が困難となっており、この分野の研究を阻害している。これらの課題に対処するため、本研究では「マルチポーズ異常検出(Multi-pose Anomaly Detection, MAD)」データセットと「姿勢に依存しない異常検出(Pose-agnostic Anomaly Detection, PAD)ベンチマーク」を構築した。これは、姿勢に依存しない異常検出という問題に初めて取り組む一歩となる。具体的には、20種類の複雑な形状を持つLEGOおもちゃを用い、各オブジェクトに対して4,000枚以上の異なる姿勢からの高解像度画像を収集し、シミュレート環境および実環境の両方で高品質かつ多様な3D異常を含むデータセットを構築した。さらに、MADデータセットを用いて学習された新しい手法「OmniposeAD」を提案した。この手法は、姿勢の違いを無視して異常を検出することを目的として特別に設計されている。包括的な評価を通じて、本研究で提案するデータセットおよび手法の有効性を実証した。また、8つの異常検出パラダイムをカバーするベースライン手法を含むオープンソースのベンチマークライブラリを公開し、今後の研究および応用を促進することを目的としている。コード、データ、モデルはすべて公開されており、GitHubにて利用可能である:https://github.com/EricLee0224/PAD。