2달 전
CoVA: 웹페이지 정보 추출을 위한 문맥 인식 시각적 주의력
Anurendra Kumar; Keval Morabia; Jingjin Wang; Kevin Chen-Chuan Chang; Alexander Schwing

초록
웹페이지 정보 추출(WIE)은 지식 기반을 생성하는 데 중요한 단계입니다. 이를 위해 전통적인 WIE 방법들은 웹사이트의 문서 객체 모델(DOM) 트리를 활용합니다. 그러나 DOM 트리의 사용은 맥락과 외관이 추상적으로 인코딩되어 있어 큰 도전 과제를 제기합니다. 이 문제를 해결하기 위해 우리는 WIE를 맥락 인식 웹페이지 객체 검출 작업으로 재정식화하는 것을 제안합니다. 구체적으로, 우리는 외관 특징과 DOM 트리의 문법적 구조를 결합한 맥락 인식 시각적 주의(CoVA) 검출 파이프라인을 개발하였습니다. 이 접근 방식을 연구하기 위해 우리는 전자 상거래 웹사이트의 새로운 대규모 데이터셋을 수집하였으며, 각 웹 요소를 제품 가격, 제품 제목, 제품 이미지 및 배경이라는 네 가지 라벨로 수동으로 주석을 달았습니다. 이 데이터셋에서 우리는 제안된 CoVA 접근 방식이 기존 최신 방법들을 개선하는 새로운 도전적인 베이스라인임을 보여주었습니다.