8日前

ノイズのあるラベルで学習する際のアンカーポイントの代替としてのクラスタビリティ

Zhaowei Zhu, Yiwen Song, Yang Liu
ノイズのあるラベルで学習する際のアンカーポイントの代替としてのクラスタビリティ
要約

ノイズのあるラベルを用いた学習において、訓練インスタンスが誤ってラベル付けされる確率を特徴付けるラベルノイズ遷移行列は、多くの既存の解決策の設計において極めて重要な役割を果たしている。従来の手法は、特定のクラスにほぼ確実に属するインスタンス(いわゆる「アンカー点」)またはその近似を特定することに大きく依存している。しかし、アンカー点の探索は依然として非自明な課題であり、その推定精度も入手可能なアンカー点の数に制約されることが多くある。本論文では、上記の課題に対する代替的なアプローチを提案する。本研究の主な貢献は、クラスタビリティ条件に基づく効率的な推定手法の発見にある。我々は、特徴表現がクラスタ可能である条件下で、隣接する表現間のラベルノイズに対する3次までのコンセンサスを用いることで、一意な遷移行列の推定が可能であることを理論的に証明した。アンカー点を用いる従来の手法と比較して、本手法ははるかに多くのインスタンスを活用でき、サンプル複雑度の観点から著しく優れた性能を発揮する。合成的なノイズラベル(CIFAR-10/100上)および実際のヒューマンレベルのノイズラベル(Clothing1Mおよび我々が独自に収集したヒューマンアノテートCIFAR-10)を用いた実験により、本手法の推定精度およびその優位性を実証した。本研究のコードおよびヒューマンレベルのノイズを含むCIFAR-10ラベルデータは、https://github.com/UCSC-REAL/HOC にて公開されている。

ノイズのあるラベルで学習する際のアンカーポイントの代替としてのクラスタビリティ | 最新論文 | HyperAI超神経