
초록
엔티티 간의 관계는 상업적으로 민감한 정보와 같은 민감 정보를 분류하는 데 있어 신뢰할 수 있는 지표가 될 수 있다. 예를 들어, '사람-회사의 이사이다'라는 관계는 개인의 급여가 민감한 개인정보로 간주되어야 하는지를 판단하는 데 도움을 줄 수 있다. 이러한 관계를 표현하기 위해 종종 지식 그래프를 활용하여 다양한 엔티티 쌍에 걸쳐 일반화된 관계 유형의 임베딩을 학습한다. 그러나 특정 관계 유형이 민감성과 관련이 있는지 여부는 해당 관계에 참여하는 엔티티의 종류에 따라 달라질 수 있다. 따라서 일반화된 관계 임베딩만으로는 민감 정보를 효과적으로 분류하기에는 부족한 경우가 많다. 본 연구에서는 엔티티와 관계를 하나의 임베딩 내에서 통합적으로 표현하는 새로운 방법을 제안하여, 엔티티 간의 관계를 보다 정확히 포착하고자 한다. 또한, 기존 문헌에서 제안된 관계 임베딩 기반 분류 방법과 비교하여, 제안하는 엔티티-관계-엔티티 임베딩 접근법이 민감성 분류의 효과성을 유의미하게 향상시킬 수 있음을 보여준다(McNemar 검정, p < 0.05). 분류 성능은 F1 점수 기준으로 0.426(제안 방법) 대 0.413(기존 방법)로 나타났다.