16일 전

RDF2Vec: RDF 그래프 임베딩 및 그 응용

{Petar Ristoski, Tommaso Di Noia, Renato De Leone, Jessica Rosati, Heiko Paulheim}
RDF2Vec: RDF 그래프 임베딩 및 그 응용
초록

링크드 오픈 데이터는 데이터 마이닝 및 정보 검색 작업에서 배경 정보의 귀중한 원천으로 인식되고 있다. 그러나 기존의 대부분의 도구들은 명제형 형태의 특징, 즉 인스턴스와 연결된 명목형 또는 수치형 특징의 벡터를 요구하는 반면, 링크드 오픈 데이터 소스는 본질적으로 그래프 구조를 가지고 있다. 본 논문에서는 언어 모델링 기법을 활용하여 단어 시퀀스에서 비지도 특징 추출을 수행하는 RDF2Vec을 제안한다. 이 기법은 RDF 그래프에 적합하도록 조정된다. 우리는 Weisfeiler-Lehman 서브트리 RDF 그래프 커널과 그래프 워크를 통해 그래프 하위 구조에서 얻은 국소 정보를 활용하여 시퀀스를 생성하고, RDF 그래프 내 엔티티의 잠재적 수치적 표현을 학습한다. 제안한 방법은 세 가지 다른 작업에 대해 평가되었다: (i) 표준 머신러닝 작업, (ii) 엔티티 및 문서 모델링, (iii) 콘텐츠 기반 추천 시스템. 평가 결과, 제안된 엔티티 임베딩이 기존 기법들을 능가하며, DBpedia 및 Wikidata와 같은 일반 지식 그래프의 사전 계산된 특징 벡터 표현이 다양한 작업에 쉽게 재사용될 수 있음을 확인하였다.

RDF2Vec: RDF 그래프 임베딩 및 그 응용 | 최신 연구 논문 | HyperAI초신경