要約
本稿では、不完全な多視点クラスタリング解析における2つの課題に着目する。すなわち、(i) ラベルを用いずに異なる視点間で情報量豊かかつ一貫性のある表現を学習する方法、および (ii) データから欠落している視点を復元する方法である。これらの課題に対処するために、情報理論の観点から表現学習とデータ復元を統合した新たな目的関数を提案する。具体的には、対照学習を用いて異なる視点間の相互情報量を最大化することで、情報量豊かで一貫性のある表現を学習し、双方向予測を通じて異なる視点の条件付きエントロピーを最小化することで、欠落した視点を復元する。筆者の知る限り、本研究は一貫性のある表現学習と視点間データ復元を統一する理論的枠組みを提供する初の試みである。広範な実験結果から、提案手法が4つの困難なデータセットにおいて、10の競合的手法を顕著に上回ることを示している。コードは https://pengxi.me で公開されている。