HyperAIHyperAI

Command Palette

Search for a command to run...

TextOCR 텍스트 인식 데이터 세트

Discord에서 논의하기

날짜

4년 전

조직

게시 URL

textvqa.org

Paper URL

arxiv.org

라이선스

CC BY 4.0

Featured Image

OCR은 광학 문자 인식을 의미합니다. TextOCR은 모든 장면에서 텍스트를 감지하고 인식하는 데 사용되는 데이터 세트입니다. TextOCR은 TextVQA의 이미지에 대해 약 100만 개의 고품질 단어 주석을 제공하고, 시각적 질의응답이나 이미지 캡션 작성과 같은 다운스트림 작업에 대한 종단 간 추론을 수행할 수 있습니다. 데이터 세트에는 다음이 포함됩니다.

  • TextVQA 데이터 세트의 28,134개 이미지
  • 903,096개의 주석이 달린 장면 텍스트 단어
  • 평균적으로 각 이미지에는 32개의 관련 단어가 있습니다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp