9日前

Difficulty-Net:長尾認識における難易度予測を学習する

Saptarshi Sinha, Hiroki Ohashi
Difficulty-Net:長尾認識における難易度予測を学習する
要約

長尾データセットでは、ヘッドクラス(頻度の高いクラス)の訓練サンプル数がテールクラス(頻度の低いクラス)に比べて大幅に多いことが多いため、認識モデルはヘッドクラスにバイアスされがちである。この問題を軽減するための代表的な手法として重み付き損失が広く用いられている。近年の研究では、従来のクラス頻度ではなく、クラスの難易度(class-difficulty)が重みの分布を決定する上でより適切な指標である可能性が示唆されている。しかし、先行研究では難易度を定量化するためのヒューリスティックな式が採用されており、我々の実証的調査により、最適な定式化はデータセットの特性に依存することが明らかになった。この課題に対応して、本研究ではメタラーニングフレームワークを用いて、モデルの性能に基づいてクラスの難易度を学習する「Difficulty-Net」を提案する。クラスの難易度を他のクラスとの関係性の中で適切に評価できるようにするため、新たに「相対的難易度(relative difficulty)」と「ドライバ損失(driver loss)」という2つの重要な概念を導入した。前者は、あるクラスの難易度を評価する際に他のクラスの影響を考慮する役割を果たし、後者は学習が意味のある方向へ進むように導く上で不可欠な要素である。提案手法は、代表的な長尾データセットを対象とした広範な実験を通じて有効性が検証され、複数の長尾データセットにおいて最先端(state-of-the-art)の性能を達成した。

Difficulty-Net:長尾認識における難易度予測を学習する | 最新論文 | HyperAI超神経