
要約
私たちは、ラベルの付いていないデータサンプルのみを入力として、ニューラルネットワーク分類器をゼロから学習させる新しいクラスタリング目的関数を提案します。このモデルは、画像分類とセグメンテーションにわたる8つの無教師クラスタリングベンチマークで最先端の結果を達成し、意味的なクラスと正確に一致するクラスターを発見します。これらのベンチマークにはSTL10、ImageNetの無教師版、およびCIFAR10が含まれており、それぞれ最寄りの競合他社の精度を6.6および9.5の絶対パーセンテージポイントで大幅に上回っています。本手法はコンピュータビジョンに特化したものではなく、任意のペアデータセットサンプルに対して動作します。実験では、各画像からペアを得るためにランダムな変換を使用しています。訓練されたネットワークは直接意味的なラベルを出力し、外部処理が必要な高次元表現ではなくなります。目的関数は単純に各ペア間のクラス割り当てにおける相互情報量を最大化することであり、情報理論に基づいて厳密に定式化されているため、他のクラスタリング手法が陥りやすい退化解を容易に避けることができます。完全無教師モードだけでなく、2つの半教師あり設定もテストしました。最初の設定ではSTL10分類において88.8%の精度を達成し、既存のすべての方法(監督あり、半教師ありまたは無教師)を超えて新たな世界最高記録を樹立しました。2つ目の設定ではラベルカバレッジが90%削減された場合でも堅牢性が示されており、少量のラベルを使用したいアプリケーションにとって重要です。github.com/xu-ji/IIC