11일 전

팔콘 2.0: 위키데이터 기반 엔티티 및 관계 링킹 도구

Ahmad Sakor, Kuldeep Singh, Anery Patel, Maria-Esther Vidal
팔콘 2.0: 위키데이터 기반 엔티티 및 관계 링킹 도구
초록

자연어 처리(NLP) 분야는 텍스트에서 엔티티 및 관계 인식을 해결하는 데 크게 기여해왔으며, 이를 지식 그래프(KG) 내 적절한 매칭과 연결하는 데에도 기여해왔다. 위키데이터(Wikidata)를 백그라운드 지식 그래프로 고려할 때, 여전히 텍스트 내 지식을 위키데이터에 연결할 수 있는 도구는 제한적이다. 본 논문에서는 위키데이터를 대상으로 한 최초의 통합적 엔티티 및 관계 연결 도구인 Falcon 2.0을 제안한다. Falcon 2.0은 영어로 작성된 짧은 자연어 텍스트를 입력받아, 위키데이터 내 적절한 후보 엔티티 및 관계의 순위 매겨진 목록을 출력한다. 후보들은 위키데이터 내 국제화된 리소스 식별자(IRI)로 표현된다. Falcon 2.0은 엔티티 인식 작업에 영어 언어 모델(예: N-그램 타일링 및 N-그램 분할)을 활용한 후, 연결 작업에는 최적화 기법을 적용한다. 우리는 Falcon 2.0의 위키데이터 기반 성능을 실증적으로 평가한 결과, 기존의 모든 기준 대비 우수한 성능을 보였다. Falcon 2.0은 공개되어 있으며, 연구 공동체가 재사용할 수 있도록 설계되었으며, 필요한 모든 사용 지침은 GitHub 리포지토리에 철저히 문서화되어 있다. 또한 기술적 전문 지식 없이도 사용 가능한 온라인 API도 제공한다. Falcon 2.0 및 그 기반 지식베이스는 다음 주소에서 자원으로 제공된다: https://labs.tib.eu/falcon/falcon2/.

팔콘 2.0: 위키데이터 기반 엔티티 및 관계 링킹 도구 | 최신 연구 논문 | HyperAI초신경