17日前

二つが揃ってタンゴが踊れる:深層メトリック学習におけるMixup

Shashanka Venkataramanan, Bill Psomas, Ewa Kijak, Laurent Amsaleg, Konstantinos Karantzalos, Yannis Avrithis
二つが揃ってタンゴが踊れる:深層メトリック学習におけるMixup
要約

メトリック学習(metric learning)は、類似したクラスの埋め込み(embedding)が互いに近くなるように、不類似なクラスの埋め込みは遠く離れるように、判別性の高い表現を学習する手法である。最先端の手法は、主に複雑な損失関数やマイニング戦略に注目している。一方で、分類タスクにおける現代的なデータ拡張手法も、同時に2つ以上のサンプルを扱うことが特徴である。この2つのアイデアの統合は、依然として十分に研究されていない。本研究では、このギャップを埋め、混ぜ込み(mixup)を用いて表現を改善することを目的とする。mixupは、2つ以上のサンプルおよび対応するターゲットラベルを同時に線形補間する強力なデータ拡張手法である。この課題は困難である。なぜなら、分類とは異なり、メトリック学習で用いられる損失関数はサンプルごとに加算可能ではないため、ターゲットラベルの補間というアイデアが直感的ではないからである。筆者らの知る限り、本研究は深層メトリック学習において、サンプルとターゲットラベルの両方を同時に混合する初めての試みである。我々は既存のメトリック学習損失関数を包含する一般化された定式化を構築し、それをmixupに対応できるように修正することで、新しい手法「Metric Mix(Metrix)」を提案する。また、訓練中にサンプルを混合することで、訓練クラスに限定されない埋め込み空間の領域を探索していることを示すために、新たな評価指標「利用度(utilization)」を導入する。改善された表現の有効性を検証するため、入力、中間表現、または埋め込みをターゲットラベルとともに混合した場合、4つのベンチマーク深層メトリック学習データセットにおいて、最先端のメトリック学習手法を顕著に上回ることを示した。

二つが揃ってタンゴが踊れる:深層メトリック学習におけるMixup | 最新論文 | HyperAI超神経