Command Palette

Search for a command to run...

OCRBench 텍스트 인식 벤치마크 데이터 세트

날짜

4달 전

크기

60.8 MB

기관

화중과학기술대학교

논문 URL

arxiv.org

OCRBench는 화중과학기술대학교와 마이크로소프트 연구소에서 발표한 텍스트 인식 벤치마크 데이터셋입니다. 이 데이터셋은 다중 모드 대규모 광학 문자 인식(OCR)을 위한 평가 벤치마크입니다. 관련 논문 결과는 다음과 같습니다.OCRBench: 대규모 멀티모달 모델에서 OCR의 숨겨진 미스터리"는 다양한 텍스트 관련 작업에서 대규모 멀티모달 모델(LMM)의 OCR 기능을 평가하는 것을 목표로 합니다.

이 데이터 세트에는 텍스트 인식, 장면 텍스트 중앙 정렬, 문서 방향, 핵심 정보 추출(KIE), 손으로 쓴 수학 표현식(HMER) 등 5가지 대표적인 텍스트 관련 작업에서 수동으로 검토하고 수정한 1000개의 질문-답변 쌍이 포함되어 있습니다.

데이터에는 다음이 포함됩니다.

  • 300개의 이미지(일반, 불규칙, 예술적 및 기타 텍스트 유형 포함)를 텍스트로 인식합니다.
  • 장면 텍스트 중심의 시각적 질문 200개 질문에 답합니다.
  • 문서 안내 시각적 질문으로 200개의 질문에 답합니다.
  • 핵심 정보 추출을 위한 200개의 질문.
  • HME100k 데이터 세트에서 가져온 100개 이미지로 손으로 쓴 수학적 표현을 인식합니다.
OCRBench.torrent
시딩 1다운로드 중 0완료됨 67총 다운로드 횟수 169
  • OCRBench/
    • README.md
      1.65 KB
    • README.txt
      3.3 KB
      • data/
        • OCRBench.zip
          60.8 MB

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
OCRBench 텍스트 인식 벤치마크 데이터 세트 | 데이터셋 | HyperAI초신경