
현재 최첨단 장면 변화 감지(Scene Change Detection, SCD) 접근법은 잘 훈련된 연구 데이터에서 놀라운 결과를 달성하지만, 미처 경험하지 못한 환경과 다른 시간 조건에서는 신뢰성이 저하됩니다. 도메인 내 성능은 이전에 본 적 없는 환경에서는 77.6%에서 8.0%로, 다른 시간 조건에서는 4.6%로 급격히 하락합니다. 이러한 문제를 해결하기 위해 일반화 가능한 SCD 및 벤치마크의 필요성이 제기되고 있습니다.본 연구에서는 미처 경험하지 못한 도메인 성능과 시간 일관성을 개선하여 SCD의 요구 증가에 대응하기 위한 Generalizable Scene Change Detection Framework (GeSCF)를 제안합니다. 우리의 방법은 사전 훈련된 Segment Anything Model (SAM)을 제로샷 방식으로 활용합니다. 이를 위해 초기 가상 마스크 생성(Initial Pseudo-mask Generation)과 기하-의미 마스크 매칭(Geometric-Semantic Mask Matching)을 설계하여 사용자 지도 프롬프트와 단일 이미지 기반 분할을 두 입력 간의 장면 변화 감지로 자연스럽게 전환시킵니다.또한, 우리는 일반화 가능한 SCD 연구를 촉진하기 위해 새로운 메트릭과 평가 프로토콜을 포함하는 Generalizable Scene Change Detection (GeSCD) 벤치마크를 정의하였습니다. 이 과정에서 다양한 환경 시나리오, 즉 도시, 교외, 농촌 지역을 포함하는 어려운 이미지 쌍들의 집합인 ChangeVPR 데이터셋을 소개하였습니다.다양한 데이터셋에 대한 광범위한 실험 결과, GeSCF는 기존 SCD 데이터셋에서 평균 19.2%, ChangeVPR 데이터셋에서는 30.0%의 성능 향상을 보였으며, 이는 이전 연구 성과의 거의 두 배에 해당합니다. 우리는 본 연구가 견고하고 일반화 가능한 SCD 연구의 기초를 마련할 수 있다고 믿습니다.