2달 전

ColNet: 웹 표의 의미를 임베딩하여 열 유형 예측 수행

Jiaoyan Chen; Ernesto Jimenez-Ruiz; Ian Horrocks; Charles Sutton
ColNet: 웹 표의 의미를 임베딩하여 열 유형 예측 수행
초록

웹 표의 기본적인 이해를 얻기 위해 지식 기반(KB) 개념을 사용하여 열 유형을 자동으로 주석화하는 작업은 매우 중요한 과제입니다. 현재 방법들은 표 메타데이터(열 이름 등) 또는 KB 내 셀의 엔티티 대응 관계에 의존하고 있으며, 불완전한 메타 정보를 가진 점점 늘어나는 웹 표와 관련된 문제를 처리하지 못할 가능성이 있습니다. 본 논문에서는 지식 기반 추론과 조회를 머신 러닝과 통합할 수 있으며, 예측을 위해 합성곱 신경망(Convolutional Neural Networks)을 자동으로 훈련시킬 수 있는 신경망 기반 열 유형 주석화 프레임워크인 ColNet을 제안합니다. 예측 모델은 단어 표현을 사용하여 셀 내부의 문맥 의미뿐만 아니라, 여러 셀에서 지역 특성을 학습하여 열의 의미를 임베딩(embeds)합니다. 이 방법은 DBPedia와 두 가지 다른 웹 표 데이터셋(T2Dv2는 일반 웹에서, Limaye는 위키백과 페이지에서 추출됨)을 통해 평가되었으며, 최신 접근법들보다 더 높은 성능을 달성하였습니다.

ColNet: 웹 표의 의미를 임베딩하여 열 유형 예측 수행 | 최신 연구 논문 | HyperAI초신경