문서 레이아웃 분석

문서 레이아웃 분석(DLA)은 컴퓨터 비전 분야의 하위 작업으로, 문서의 물리적 구조를 결정하는 것을 목표로 합니다. 즉, 문서 내의 다양한 구성 요소를 식별하는 것입니다. 이러한 구성 요소는 인접한 픽셀이 하나의 영역을 형성한 개별 연결된 구성 영역이나 텍스트 줄 그룹일 수 있습니다. 텍스트 줄은 서로 가까운 문자, 기호, 단어들이 일직선으로 연결되어 있는 집합을 의미하며, 일반적으로 수평 또는 수직 방향을 가집니다. 이 작업은 자동화된 문서 처리, 정보 추출, 콘텐츠 이해 등에 중요한 응용 가치를 가지고 있습니다.

문서 레이아웃 분석 | SOTA | HyperAI초신경