11日前

Dash:動的しきい値を用いた半教師付き学習

Yi Xu, Lei Shang, Jinxing Ye, Qi Qian, Yu-Feng Li, Baigui Sun, Hao Li, Rong Jin
Dash:動的しきい値を用いた半教師付き学習
要約

半教師あり学習(Semi-Supervised Learning, SSL)は、ラベルなしデータの有効活用により、多くの機械学習タスクにおいて大きな注目を集めている。しかし、既存のSSLアルゴリズムは、訓練プロセス中、ラベルなしサンプルをすべて使用するか、あるいは固定された高信頼度の予測を持つラベルなしサンプルのみを用いるという限界がある。この方法では、正しく予測された(あるいは誤って予測された)サンプルが過剰に排除され(あるいは選択され)る可能性がある。本研究では、既存のSSL手法を適用する際に、ラベル付きデータと関連する疑似ラベルを持つラベルなしサンプルのみを用いてモデルを学習するため、ラベルなしデータから訓練サンプルのサブセットを選択する、シンプルかつ強力なフレームワークを提案する。この選択は、各更新反復において、損失値が動的に調整される閾値未満のサンプルのみを保持することで実現される。提案手法「Dash」は、ラベルなしデータ選択における適応性と理論的保証を兼ね備えている。特に、非凸最適化の観点からDashの収束速度を理論的に確立した。最後に、最先端手法と比較して、ベンチマーク上での実験により、本手法の有効性を実証した。

Dash:動的しきい値を用いた半教師付き学習 | 最新論文 | HyperAI超神経