HyperAIHyperAI

Command Palette

Search for a command to run...

OmniParsingBench 멀티모달 구문 분석 기능 평가 데이터 세트

날짜

한 달 전

조직

Alibaba Group

Paper URL

2603.09677

라이선스

Apache 2.0

OmniParsingBench는 알리바바가 2026년에 공개한 멀티모달 대규모 모델(MLLM)의 통합 구문 분석 기능을 평가하기 위한 벤치마크 데이터셋입니다. 관련 연구 논문으로는 다음과 같은 것들이 있습니다... 로직-파싱-옴니 기술 보고서이 방법은 기존의 단일 작업 평가의 한계를 극복하고, 인지에서 인식에 이르는 전 과정에 걸쳐 모델의 역량을 체계적으로 평가하는 것을 목표로 하며, 멀티모달 이해, 구조화된 정보 추출, 복잡한 추론 능력 연구 등 다양한 시나리오에서 널리 활용됩니다. 이 데이터셋은 약 5,294개의 샘플로 구성되어 있으며, 6가지 양식(자연 이미지, 그래픽, 문서, 오디오, 자연 비디오, 텍스트 중심 비디오)을 포괄합니다. 또한, 지각(Perc.), 인지(Cog.), 종합(Ovr.)의 세 가지 평가 지표를 제시합니다. 각 데이터셋은 이미지 또는 오디오/비디오 입력과 이에 상응하는 구조화된 구문 분석 작업을 포함합니다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp