Command Palette
Search for a command to run...
ノイズロバストな対比損失を用いた部分的視線整合表現学習
ノイズロバストな対比損失を用いた部分的視線整合表現学習
Xi Peng Peng Hu Zitao Liu Zhenyu Huang Yunfan Li Mouxing Yang
概要
現実の応用において、空間的・時間的・あるいは空間時間的な非同期性により、複数のビュー間でデータの一部しか対応づけられていないことが一般的であり、このような状況はいわゆる「部分的ビュー対応問題(Partially View-aligned Problem, PVP)」と呼ばれる。本研究では、ラベルを用いずにこの未十分に研究されている問題に取り組むため、ノイズに強い対照学習損失を用いて、表現学習とデータ対応付けを同時に実現する手法を提案する。具体的には、あるビューからのサンプルに対して、他のビューにおける同カテゴリの対応サンプルを同定することを目的とし、これによりビュー間の対応関係を構築する。対照学習はデータペアを入力として必要とするため、既知の対応関係に基づいてポジティブペアを構成し、ランダムサンプリングによってネガティブペアを生成する。ランダムサンプリングによって生じる誤ったネガティブ例(false negatives)の影響を緩和、あるいは排除するために、誤ったネガティブ例がネットワークの最適化を支配しないよう適応的に制御するノイズに強い対照学習損失を提案する。ハンガリアンアルゴリズムやその変種とは異なり、本手法はインスタンスレベルの対応ではなく、カテゴリレベルの対応を実現することを目指している。カテゴリレベルの対応は、クラスタリングや分類といったタスクにおいてよりアクセスしやすく、スケーラビリティに優れているため、より望ましい。さらに、本研究の知見によれば、対照学習がノイズのあるラベルに頼らずに robust に動作するという点で、これは初めての成功例であると考えられる。広範な実験により、本手法が10種類の最先端マルチビュー手法と比較して、クラスタリングおよび分類タスクにおいて優れた性能を示すことが確認された。