3ヶ月前

潜在カテゴリからの学習によるロングテール認識

Weide Liu, Zhonghua Wu, Yiming Wang, Henghui Ding, Fayao Liu, Jie Lin, Guosheng Lin
潜在カテゴリからの学習によるロングテール認識
要約

本研究では、長尾画像認識という困難なタスクに取り組む。従来の長尾認識手法は、モデルの学習過程において尾部クラス(tail classes)に注目を向けるために、主に尾部クラスのデータ拡張や再バランス戦略に注力してきた。しかし、尾部クラスに限られた学習画像しか存在しないため、尾部クラスの画像の多様性は依然として制限されており、結果として特徴表現が劣化するという問題がある。本研究では、頭部クラス(head classes)と尾部クラスの間に共通する潜在的特徴(latent features)を活用することで、より優れた特徴表現が可能になると仮定する。この洞察に基づき、潜在的カテゴリに基づく長尾認識(Latent Categories based long-tail Recognition, LCReg)手法を提案する。具体的には、頭部クラスと尾部クラスの両方に共通して利用可能なクラス無差別な潜在的特徴を学習する。さらに、これらの潜在的特徴に対して意味的データ拡張(semantic data augmentation)を適用することで、学習サンプルの多様性を間接的に豊かにする。5つの長尾画像認識データセットにおける広範な実験結果から、提案手法LCRegが従来手法を顕著に上回り、最先端の性能を達成できることを示した。