
要約
最近、小規模かつ多様性に欠けるデータセットで訓練された深層ニューラルネットワークモデルは、過学習やロバスト性の低下、一般化性能の劣化といった制約を緩和するため、データ拡張(data augmentation)を用いることが一般的である。特に3次元(3D)データセットを用いる手法では、ランダムな点の削除、スケーリング、平行移動、回転、ジャイタリング(jittering)といったデータ拡張技術が広く採用されている。しかし、これらの手法は固定されたものであり、対象オブジェクト全体に一様に適用されるため、オブジェクト表面の局所的な幾何構造を無視するという課題を抱えている。オブジェクト表面における異なる局所領域は、それぞれ異なる程度の幾何的複雑性を有している。したがって、オブジェクト全体に同一のデータ拡張手法を適用することは、構造が複雑な局所領域の拡張にはあまり効果的ではない。本論文では、局所的な領域に応じて異なるデータ拡張手法を適用できる「PatchAugment」というデータ拡張フレームワークを提案する。PointNet++およびDGCNNモデルを用いた実験により、3次元点群分類タスクにおけるPatchAugmentの有効性を実証した。本手法は、ModelNet40(合成データ)、ModelNet10(合成データ)、SHREC’16(合成データ)、ScanObjectNN(実世界データ)の4つのベンチマークデータセットを用いて、これらのモデルに対して評価された。