HyperAI초신경

홈 플랫폼 문서 뉴스 연구 논문 튜토리얼 데이터셋 백과사전 SOTA LLM 모델 GPU 랭킹 컨퍼런스

한국어

HyperAI초신경

OCRBench 텍스트 인식 벤치마크 데이터 세트

날짜

4달 전

크기

60.8 MB

기관

논문 URL

태그

텍스트 인식

데이터셋 다운로드

Discord 커뮤니티 참여

OCRBench는 화중과학기술대학교와 마이크로소프트 연구소에서 발표한 텍스트 인식 벤치마크 데이터셋입니다. 이 데이터셋은 다중 모드 대규모 광학 문자 인식(OCR)을 위한 평가 벤치마크입니다. 관련 논문 결과는 다음과 같습니다.OCRBench: 대규모 멀티모달 모델에서 OCR의 숨겨진 미스터리"는 다양한 텍스트 관련 작업에서 대규모 멀티모달 모델(LMM)의 OCR 기능을 평가하는 것을 목표로 합니다.

이 데이터 세트에는 텍스트 인식, 장면 텍스트 중앙 정렬, 문서 방향, 핵심 정보 추출(KIE), 손으로 쓴 수학 표현식(HMER) 등 5가지 대표적인 텍스트 관련 작업에서 수동으로 검토하고 수정한 1000개의 질문-답변 쌍이 포함되어 있습니다.

데이터에는 다음이 포함됩니다.

300개의 이미지(일반, 불규칙, 예술적 및 기타 텍스트 유형 포함)를 텍스트로 인식합니다.

장면 텍스트 중심의 시각적 질문 200개 질문에 답합니다.

문서 안내 시각적 질문으로 200개의 질문에 답합니다.

핵심 정보 추출을 위한 200개의 질문.

HME100k 데이터 세트에서 가져온 100개 이미지로 손으로 쓴 수학적 표현을 인식합니다.

OCRBench.torrent

시딩 1다운로드 중 0완료됨 67총 다운로드 횟수 169

OCRBench/
- README.md
  1.65 KB
- README.txt
  3.3 KB

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩

즉시 사용 가능한 GPU

최적 가격

Hyper Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

OCRBench 텍스트 인식 벤치마크 데이터 세트 | 데이터셋 | HyperAI초신경