HyperAI초신경

OCRBench 텍스트 인식 벤치마크 데이터 세트

날짜

2일 전

기관

화중과학기술대학교

발행 주소

huggingface.co

다운로드 도움말

OCRBench는 화중과학기술대학교와 마이크로소프트 연구소에서 발표한 텍스트 인식 벤치마크 데이터셋입니다. 이 데이터셋은 다중 모드 대규모 광학 문자 인식(OCR)을 위한 평가 벤치마크입니다. 관련 논문 결과는 다음과 같습니다.OCRBench: 대규모 멀티모달 모델에서 OCR의 숨겨진 미스터리"는 다양한 텍스트 관련 작업에서 대규모 멀티모달 모델(LMM)의 OCR 기능을 평가하는 것을 목표로 합니다.

이 데이터 세트에는 텍스트 인식, 장면 텍스트 중심, 문서 방향, 핵심 정보 추출(KIE), 손으로 쓴 수학 표현식(HMER) 등 5가지 대표적인 텍스트 관련 작업에서 수동으로 검토하고 수정한 1000개의 질문-답변 쌍이 포함되어 있습니다.

데이터에는 다음이 포함됩니다.

  • 300개의 이미지(일반, 불규칙, 예술적 및 기타 텍스트 유형 포함)를 텍스트로 인식합니다.
  • 장면 텍스트 중심의 시각적 질문 200개 질문에 답합니다.
  • 문서 안내 시각적 질문으로 200개의 질문에 답합니다.
  • 핵심 정보 추출을 위한 200개의 질문.
  • HME100k 데이터 세트에서 가져온 100개 이미지로 손으로 쓴 수학적 표현을 인식합니다.