11日前

幾何学的およびテクスチャ的オーグメンテーションによるドメインギャップ低減

{Peter Hall, Yong-Liang Yang, Xiao-Chang Liu}
幾何学的およびテクスチャ的オーグメンテーションによるドメインギャップ低減
要約

物体認識を目的とした畳み込みニューラルネットワークは、テクスチャパッチの低レベル統計に学習が偏っているため、描写の変化に対して脆弱であることが研究で示されている。近年の研究では、訓練データにスタイル転送(style transfer)を適用することで、特定の描写スタイルへの過剰適合(over-fitting)を緩和し、モデルのロバスト性を向上させるアプローチが注目されている。これらの手法は性能向上を実現しているが、実際の芸術作品に見られる物体形状の幾何学的変化に注目しておらず、アーティストが意図的に物体を変形・歪ませて芸術的効果を表現する点を無視している。この観察に基づき、本研究では、訓練データのテクスチャと幾何形状の多様性を同時に増加させることで、学習バイアスを低減する手法を提案する。すなわち、アーティストが用いる形状の変化を含む視覚的オブジェクトクラスを拡張する。具体的には、各オブジェクトクラスに含まれる変形(warp)の分布を学習する。さらに、多様なスタイル分布に基づくテクスチャ拡張と組み合わせることで、実験により複数のクロスドメインベンチマークにおいて性能の向上を確認した。