2ヶ月前

オープンワールド半教師あり学習

Cao, Kaidi ; Brbic, Maria ; Leskovec, Jure
オープンワールド半教師あり学習
要約

半教師あり学習を実世界の設定に適用する際の根本的な制限は、ラベルのないテストデータがラベリングされた訓練データで以前に遭遇したクラスのみを含むという仮定である。しかし、この仮定は野生のデータではほとんど成立せず、新しいクラスに属するインスタンスがテスト時に現れることもある。本稿では、新しいクラスがラベルのないテストデータに現れる可能性を形式化した新たなオープンワールド半教師あり学習設定を導入する。この新設定において、目標はラベリングされたデータとラベルのないデータ間のクラス分布の不一致を解消することであり、テスト時には各入力インスタンスを既存のクラスのいずれかに分類するか、新しい未見のクラスを初期化する必要がある。この困難な問題に対処するために、我々はORCA(Open-World Recognition with Class Adaptation)と呼ばれるエンドツーエンドの深層学習アプローチを提案する。ORCAは、既知のクラスに対して未知のクラスよりも速く判別的特徴を学習することで生じるバイアスを回避するための不確実性適応マージンメカニズムを導入している。これにより、ORCAは既知と未知のクラス間におけるクラス内分散ギャップを縮小する。画像分類データセットや単一細胞注釈データセットでの実験結果から、ORCAが代替基準モデルに対して一貫して優れた性能を示し、ImageNetデータセットにおいて既知クラスでは25%、未知クラスでは96%の改善率を達成することが確認された。

オープンワールド半教師あり学習 | 最新論文 | HyperAI超神経