13日前
対照的階層クラスタリング
Michał Znaleźniak, Przemysław Rola, Patryk Kaszuba, Jacek Tabor, Marek Śmieja

要約
ディープクラスタリングは、データセットを事前に定義された数のグループに分割する平坦型モデルによって主導されてきた。近年の手法は、一般的なベンチマークにおいて非常に高い真値との類似性を達成しているが、平坦な分割に含まれる情報は限られている。本論文では、深層ニューラルネットワークを基盤とする対照的階層クラスタリングモデルであるCoHiClustを提案する。このモデルは、典型的な画像データに適用可能である。自己教師学習アプローチを用いることで、CoHiClustはラベル付きデータにアクセスせずに、ベースネットワークを二分木構造に抽出する。得られた階層的クラスタリング構造は、クラスタ間の関係性を分析したり、データポイント間の類似性を測定するのに利用できる。実験結果から、CoHiClustが直感的かつ画像の意味論と整合する合理的なクラスタ構造を生成することが示された。さらに、多数の画像データセットにおいて、最先端の平坦型クラスタリングモデルと比較して優れたクラスタリング精度を達成していることが確認された。