HyperAI

CC-OCR 데이터 세트는 알리바바 그룹, 화중과학기술대학교, 남중국이공대학교가 2024년에 공동으로 개발한 것으로, 텍스트 인식(OCR) 작업에서 대규모 멀티모달 모델의 성능을 평가하기 위한 포괄적이고 까다로운 벤치마크를 제공합니다.CC-OCR: 문해력 분야의 대규모 다중 모드 모델을 평가하기 위한 포괄적이고 도전적인 OCR 벤치마크".

이 데이터 세트는 다중 장면 텍스트 읽기, 다국어 텍스트 읽기, 문서 구문 분석, 핵심 정보 추출이라는 4가지 핵심 작업을 다루며, 39개 하위 세트와 7,058개의 완전히 주석이 달린 이미지를 포함합니다. CC-OCR의 출시는 복잡한 구조와 세밀한 시각적 과제에서 현재 멀티모달 모델을 평가하는 데 있어 부족한 부분을 채워주며, 실제 응용 분야에서 멀티모달 모델의 발전을 촉진하는 데 큰 의의가 있습니다.

CC-OCR 텍스트 인식 데이터 세트