HyperAIHyperAI

Command Palette

Search for a command to run...

DP-SSL:少量ラベル付きサンプルを用いた堅牢な半教師付き学習へ

Yi Xu Jiandong Ding Lu Zhang Shuigeng Zhou

概要

ラベル付きデータの不足は、深層学習における重要な障壁である。半教師あり学習(SSL)は、擬似ラベルを用いてラベルなしデータを活用する有望なアプローチである。しかし、ラベル付きデータが極めて少ない場合(たとえばクラスあたり数サンプル程度)には、SSLの性能が著しく低下し、不安定になる傾向がある。これは、学習された擬似ラベルの品質が低いためである可能性が高い。本論文では、ラベルなしデータに対して確率的ラベルを生成するための新規なSSL手法であるDP-SSLを提案する。本手法は、データプログラミング(DP)の革新的な枠組みを採用しており、従来のDP手法が人間の専門家による初期ラベル関数(LF)の提供に依存するのに対し、我々はSSLの枠組みに従い、ラベル関数を完全に自動的に生成する多選択学習(MCL)に基づくアプローチを構築した。生成されたLFから得られるノイズを含むラベルをもとに、ラベルモデルを設計し、これらのノイズラベル間の矛盾や重複を解消し、最終的にラベルなしサンプルに対して確率的ラベルを推定する。4つの標準的なSSLベンチマークを用いた広範な実験の結果、DP-SSLはラベルなしデータに対して信頼性の高いラベルを提供でき、特にラベル付きサンプル数が限られた状況において、既存のSSL手法を上回る分類性能を達成した。具体的には、CIFAR-10においてラベル付きサンプルがたった40個の場合でも、DP-SSLはラベルなしデータに対して93.82%のラベル付与精度、テストデータ上で93.46%の分類精度を達成し、従来の最先端(SOTA)手法を上回る結果を示した。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています