
要約
クラスタリングは、データの類似性に基づいてデータインスタンスをグループ化することを目的とする、データマイニングにおける代表的なタスクである。これは探索的かつ教師なしのタスクであり、その結果は多くのパラメータに依存するため、専門家が満足のいく結果を得るまで何度も反復する必要がある。制約付きクラスタリングは、専門家の期待をより正確にモデル化するための手法として提案されたが、依然として不十分である。なぜなら、通常、制約はクラスタリングプロセスの開始前に与えられなければならないからである。本稿では、専門家の制約をクラスタリング処理の途中で動的に追加するという、クラスタリングの探索プロセスをより一般的にモデル化する問題に取り組む。我々は、アクティブクエリ戦略と制約プログラミング(Constraint Programming)モデルを統合したインクリメンタルな制約付きクラスタリングフレームワークを提案する。このフレームワークは、専門家の期待に適合しつつ、分割の安定性を維持することで、専門家がプロセスを理解し、その影響を把握できるようにする。本モデルは、インスタンスレベルおよびグループレベルの制約をサポートしており、これらの制約は緩和可能である。標準データセットを用いた実験および衛星画像時系列データの分析を目的とした事例研究を通じて、本フレームワークの有効性が示された。