9日前
MetaSAug:長尾視覚認識のためのメタ意味拡張
Shuang Li, Kaixiong Gong, Chi Harold Liu, Yulin Wang, Feng Qiao, Xinjing Cheng

要約
現実世界の訓練データは、多数派のクラスが少数派のクラスに比べて著しく多くのサンプルを有する長尾分布を示すことが一般的である。このような不均衡は、バランスの取れた訓練データを想定して設計された従来の教師あり学習アルゴリズムの性能を低下させる。本論文では、最近提案された暗黙的意味的データ拡張(Implicit Semantic Data Augmentation; ISDA)手法を用いて少数派クラスを拡張することで、この問題に対処する。ISDAは、深層特徴を多数の意味的に意味のある方向に変換することで、多様な拡張サンプルを生成する。重要な点として、ISDAはクラス条件付き統計量を推定して意味的方向を導出するが、少数派クラスでは訓練データが不足しているため、このような推定は効果が薄いことが明らかになった。そこで、メタ学習を用いて変換された意味的方向を自動的に学習する新たなアプローチを提案する。具体的には、訓練中の拡張戦略を動的に最適化し、小さなバランスの取れた検証データセットにおける損失を最小化することを目指す。この最適化は、メタ更新ステップにより近似された検証セットを用いて実現される。CIFAR-LT-10/100、ImageNet-LT、およびiNaturalist 2017/2018における広範な実証実験により、本手法の有効性が検証された。