2달 전

데이터 증강 없이 깊은 온라인 클러스터링 붕괴를 방지하기 위한 강한 정규화

Louis Mahon; Thomas Lukasiewicz
데이터 증강 없이 깊은 온라인 클러스터링 붕괴를 방지하기 위한 강한 정규화
초록

온라인 딥 클러스터링은 특성 추출 네트워크와 클러스터링 모델을 함께 사용하여 각 새로운 데이터 포인트나 배치가 처리될 때마다 클러스터 라벨을 할당하는 기술을 의미합니다. 오프라인 방법보다 빠르고 유연하지만, 온라인 클러스터링은 인코더가 모든 입력을 동일한 점으로 매핑하여 모든 데이터를 단일 클러스터에 배치하는 붕괴된 해에 쉽게 도달할 수 있습니다. 기존의 성공적인 모델들은 이 문제를 피하기 위해 다양한 기법을 사용하였으며, 대부분 데이터 증강이 필요하거나 데이터셋 전체에서 각 클러스터의 평균 소프트 할당이 동일하도록 하는 목표를 가지고 있습니다. 우리는 데이터 증강이 필요하지 않고, 기존 방법과 달리 하드 할당을 규제하는 방법을 제안합니다. 베이지안 프레임워크를 사용하여, 인코더 네트워크의 훈련에 직관적으로 포함될 수 있는 최적화 목적함수를 도출하였습니다. 4개의 이미지 데이터셋과 1개의 인간 활동 인식 데이터셋에서 테스트한 결과, 이 방법은 다른 방법들보다 더 안정적으로 붕괴를 피하고 더 정확한 클러스터링을 제공하였습니다. 또한, 하드 클러스터 할당을 규제하는 선택의 타당성을 입증하기 위한 추가 실험과 분석도 수행하였습니다. 코드는 https://github.com/Lou1sM/online_hard_clustering에서 확인할 수 있습니다.

데이터 증강 없이 깊은 온라인 클러스터링 붕괴를 방지하기 위한 강한 정규화 | 최신 연구 논문 | HyperAI초신경