HyperAI

SA-Text는 한국과학기술원(KAIST)과 고려대학교에서 공동으로 개발한 고품질 장면 이미지의 대규모 벤치마크 데이터셋으로, 텍스트 인식 이미지 복원(TAIR) 작업을 위해 설계되었습니다. 관련 논문 결과는 다음과 같습니다.확산 모델을 사용한 텍스트 인식 이미지 복원".

이 데이터 세트에는 폴리곤 수준의 텍스트 주석이 있는 105,330개의 고해상도 장면 이미지가 포함되어 있으며, 이를 통해 이미지 내 텍스트의 위치와 모양을 정확하게 설명할 수 있어 TAIR 작업에 대한 정밀한 감독 정보를 제공하고, 모델이 이미지 내 텍스트의 위치와 구조를 더 잘 이해할 수 있게 합니다.