차단

엔티티 해상도(ER)는 다른 데이터 소스에서 동일한 실제 엔티티를 참조하는 레코드를 식별하는 작업입니다. 블로킹은 ER 프로세스에서 중요한 단계로, 계산적으로 비용이 적게 드는 방법을 사용하여 후보 레코드 쌍의 집합을 생성합니다. 이는 매처의 작업량을 크게 줄이고, 그 결과 ER의 효율성과 확장성을 향상시키는 역할을 합니다. 블로킹 기술의 목표는 불일치할 가능성이 낮은 레코드 쌍을 필터링하여, 이후 더 복잡한 매칭 과정이 고잠재력 후보 쌍에만 집중할 수 있도록 하는 것입니다. 이를 통해 시스템의 전반적인 성능이 향상됩니다.

차단 | SOTA | HyperAI초신경