HyperAIHyperAI

Command Palette

Search for a command to run...

MDPBench 다국어 문서 구문 분석 벤치마크 데이터셋

날짜

한 달 전

Paper URL

2603.28130

라이선스

Apache 2.0

MDPBench는 다국어 디지털 및 사진 문서를 분석하기 위한 벤치마크 데이터셋입니다. 관련 연구 논문으로는 다음과 같은 것들이 있습니다... MDPBench: 실제 시나리오에서 다국어 문서 구문 분석을 위한 벤치마크목표는 실제 복잡한 시나리오에서 다국어 문서를 분석하는 모델의 능력을 평가하고 개선하는 것입니다. 이 데이터셋은 간체 중국어, 번체 중국어, 영어, 아랍어, 독일어, 스페인어, 프랑스어, 힌디어, 인도네시아어, 이탈리아어, 일본어, 한국어, 포르투갈어, 러시아어, 태국어, 베트남어를 포함한 17개 언어로 된 3,400개의 문서 이미지를 포함합니다. 이미지들은 전문가 모델 주석, 수동 수정 및 수동 검증이라는 엄격한 과정을 거쳐 고품질 주석을 얻었습니다.

데이터 세트 예제
데이터 세트 예제

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp