11일 전

증분형 제약 클러스터링: 최소 가중 수정을 통한 접근

{Christel Vrain, Samir Loudni, Thi-Bich-Hanh Dao, Aymeric Beauchamp}
증분형 제약 클러스터링: 최소 가중 수정을 통한 접근
초록

클러스터링은 데이터 유사성에 따라 데이터 인스턴스를 그룹화하는 것을 목표로 하는 데이터 마이닝에서 잘 알려진 과제이다. 이는 탐색적이고 비지도적 특성을 가지며, 결과가 여러 파라미터에 크게 의존하기 때문에 전문가가 만족할 만한 결과를 얻기 위해 반복적인 시도가 필요할 수 있다. 전문가의 기대를 더 잘 모델링하기 위해 제약 조건이 있는 클러스터링(constrained clustering)이 도입되었으나, 여전히 충분하지 않다. 일반적으로 제약 조건을 클러스터링 프로세스 전에 미리 제공해야 하기 때문이다. 본 논문에서는 전문가의 제약 조건을 실시간으로 추가하면서 클러스터링 결과를 점진적으로 수정하는 시퀀스를 통해 탐색적 클러스터링 과정을 모델링하는 더 포괄적인 문제를 다룬다. 우리는 전문가의 기대에 부합하면서도 분할의 안정성을 유지할 수 있도록, 주동적 질의 전략(active query strategies)과 제약 프로그래밍(Constraint Programming) 모델을 통합한 증분형 제약 클러스터링 프레임워크를 제안한다. 이를 통해 전문가는 과정을 이해하고 그 영향을 파악할 수 있다. 제안된 모델은 인스턴스 수준과 그룹 수준의 제약 조건을 지원하며, 필요 시 이를 완화할 수 있다. 기준 데이터셋에 대한 실험과 위성 이미지 시계열 분석과 관련된 사례 연구를 통해 제안한 프레임워크의 실용성과 타당성을 입증하였다.

증분형 제약 클러스터링: 최소 가중 수정을 통한 접근 | 최신 연구 논문 | HyperAI초신경