HyperAI초신경

*이 데이터 세트는 온라인 사용을 지원합니다.여기를 클릭하여 이동하세요.

OCRBench-v2는 화중과학기술대학교, 남중국이공대학교, 바이트댄스 등 여러 기관에서 2025년에 발표한 다중 모드 대규모 모델 광학 문자 인식(OCR) 평가 벤치마크입니다. 관련 논문 결과는 다음과 같습니다.OCRBench v2: 시각적 텍스트 현지화 및 추론에 대한 대규모 멀티모달 모델을 평가하기 위한 개선된 벤치마크"는 다양한 텍스트 관련 작업에서 대규모 멀티모달 모델(LMM)의 OCR 기능을 평가하는 것을 목표로 합니다.

이 데이터셋은 OCRBench 기반의 대규모 업그레이드 버전입니다. 공개 테스트 세트로 수동 검증된 10,000개의 중국어-영어 질의응답 쌍과, 인쇄본, 전자책, 스캔 문서, 웹 콘텐츠 등 다양한 출처에서 가져온 1,500개의 수동 주석이 달린 리치 텍스트 이미지로 구성된 비공개 테스트 세트가 포함되어 있습니다. 이 데이터는 31개의 일반적인 텍스트 시나리오와 23개의 하위 작업을 포함하며, 8개의 핵심 OCR 기능(텍스트 인식, 텍스트 감지, 텍스트 참조 위치, 관계 추출, 요소 구문 분석, 수학적 연산, 시각적 텍스트 이해, 지식 추론)으로 분류됩니다.

OCRBench-v2 텍스트 인식 벤치마크 데이터 세트

*이 데이터 세트는 온라인 사용을 지원합니다.여기를 클릭하여 이동하세요.

AI로 AI 구축

Hyper Newsletters

Command Palette

OCRBench-v2 텍스트 인식 벤치마크 데이터 세트

*이 데이터 세트는 온라인 사용을 지원합니다.여기를 클릭하여 이동하세요.

AI로 AI 구축

Hyper Newsletters