날짜

3달 전

조직

Paper URL

2603.09677

라이선스

Apache 2.0

태그

OmniParsingBench는 알리바바가 2026년에 공개한 멀티모달 대규모 모델(MLLM)의 통합 구문 분석 기능을 평가하기 위한 벤치마크 데이터셋입니다. 관련 연구 논문으로는 다음과 같은 것들이 있습니다... 로직-파싱-옴니 기술 보고서이 방법은 기존의 단일 작업 평가의 한계를 극복하고, 인지에서 인식에 이르는 전 과정에 걸쳐 모델의 역량을 체계적으로 평가하는 것을 목표로 하며, 멀티모달 이해, 구조화된 정보 추출, 복잡한 추론 능력 연구 등 다양한 시나리오에서 널리 활용됩니다. 이 데이터셋은 약 5,294개의 샘플로 구성되어 있으며, 6가지 양식(자연 이미지, 그래픽, 문서, 오디오, 자연 비디오, 텍스트 중심 비디오)을 포괄합니다. 또한, 지각(Perc.), 인지(Cog.), 종합(Ovr.)의 세 가지 평가 지표를 제시합니다. 각 데이터셋은 이미지 또는 오디오/비디오 입력과 이에 상응하는 구조화된 구문 분석 작업을 포함합니다.

소환

@article{logicsparsingomni2026, 제목={Logics-Parsing-Omni: 멀티모달 구문 분석에서 세밀한 인식과 의미론적 인지의 연결}, 작성자={로직스 팀}, 저널={arXiv 사전 출판물 arXiv:2603.09677}, 연도={2026} }

이 데이터셋은 커뮤니티 사용자가 기여한 것이며 교육 및 정보 제공 목적으로만 사용됩니다. 저작권 침해와 관련된 콘텐츠가 있는 경우 [email protected]로 문의하시면 신속하게 검토 및 삭제 처리하겠습니다.

undefined

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

HyperAI

이 데이터셋 사용 Discord에서 논의하기

날짜

3달 전

조직

Paper URL

2603.09677

라이선스

Apache 2.0

태그

GPT-5.4 단계별 추론 데이터셋

3달 전

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

Command Palette

OmniParsingBench 멀티모달 구문 분석 기능 평가 데이터 세트

소환

AI로 AI 구축

HyperAI Newsletters

Command Palette

OmniParsingBench 멀티모달 구문 분석 기능 평가 데이터 세트

소환

undefined

글로벌 기후 및 에너지 전환 2000-2026 글로벌 기후 및 에너지 데이터 세트

Verbatim Spans 쿼리 조건 증거 추출 데이터 세트

SAM 3D 아티스트 객체 3D 객체 재구성 데이터 세트

FigureBench 과학 일러스트레이션 생성 벤치마크 데이터 세트

TACK 타겟 키메라 지식 기반 데이터 세트

EAVSD 전자상거래 광고 비디오 스토리보드 데이터셋

chi-bench 의료 지능형 에이전트 벤치마크 평가 데이터 세트

ViMU 비디오 은유 이해 데이터셋

VisCoR-55K 시각적 추론 데이터셋

LongBlocks 장문 컨텍스트 다국어 질문 답변 데이터셋

MathNet 멀티모달 수학 벤치마크 추론 데이터셋

Claw-Eval 실세계 벤치마크 데이터셋

QCalEval 양자 교정 그래프 이해 데이터 세트

RSRCC 원격 감지 영역 변화 이해 벤치마크 데이터 세트

PanScale 원격 감지 팬컬러 선명도 향상 데이터 세트

ParseBench 문서 구문 분석 기능 평가 데이터 세트

감정 탐지 데이터셋

MIA 다단계 추론 및 결정 궤적 데이터셋

MDPBench 다국어 문서 구문 분석 벤치마크 데이터셋

GPT-5.4 단계별 추론 데이터셋

AI로 AI 구축

HyperAI Newsletters

Command Palette

OmniParsingBench 멀티모달 구문 분석 기능 평가 데이터 세트

소환

undefined

글로벌 기후 및 에너지 전환 2000-2026 글로벌 기후 및 에너지 데이터 세트

Verbatim Spans 쿼리 조건 증거 추출 데이터 세트

SAM 3D 아티스트 객체 3D 객체 재구성 데이터 세트

FigureBench 과학 일러스트레이션 생성 벤치마크 데이터 세트

TACK 타겟 키메라 지식 기반 데이터 세트

EAVSD 전자상거래 광고 비디오 스토리보드 데이터셋

chi-bench 의료 지능형 에이전트 벤치마크 평가 데이터 세트

ViMU 비디오 은유 이해 데이터셋

VisCoR-55K 시각적 추론 데이터셋

LongBlocks 장문 컨텍스트 다국어 질문 답변 데이터셋

MathNet 멀티모달 수학 벤치마크 추론 데이터셋

Claw-Eval 실세계 벤치마크 데이터셋

QCalEval 양자 교정 그래프 이해 데이터 세트

RSRCC 원격 감지 영역 변화 이해 벤치마크 데이터 세트

PanScale 원격 감지 팬컬러 선명도 향상 데이터 세트

ParseBench 문서 구문 분석 기능 평가 데이터 세트

감정 탐지 데이터셋

MIA 다단계 추론 및 결정 궤적 데이터셋

MDPBench 다국어 문서 구문 분석 벤치마크 데이터셋

GPT-5.4 단계별 추론 데이터셋

AI로 AI 구축

HyperAI Newsletters

undefined

글로벌 기후 및 에너지 전환 2000-2026 글로벌 기후 및 에너지 데이터 세트

Verbatim Spans 쿼리 조건 증거 추출 데이터 세트

SAM 3D 아티스트 객체 3D 객체 재구성 데이터 세트

FigureBench 과학 일러스트레이션 생성 벤치마크 데이터 세트

TACK 타겟 키메라 지식 기반 데이터 세트

EAVSD 전자상거래 광고 비디오 스토리보드 데이터셋

chi-bench 의료 지능형 에이전트 벤치마크 평가 데이터 세트

ViMU 비디오 은유 이해 데이터셋

VisCoR-55K 시각적 추론 데이터셋

LongBlocks 장문 컨텍스트 다국어 질문 답변 데이터셋

MathNet 멀티모달 수학 벤치마크 추론 데이터셋

Claw-Eval 실세계 벤치마크 데이터셋

QCalEval 양자 교정 그래프 이해 데이터 세트

RSRCC 원격 감지 영역 변화 이해 벤치마크 데이터 세트

PanScale 원격 감지 팬컬러 선명도 향상 데이터 세트

ParseBench 문서 구문 분석 기능 평가 데이터 세트

감정 탐지 데이터셋

MIA 다단계 추론 및 결정 궤적 데이터셋

MDPBench 다국어 문서 구문 분석 벤치마크 데이터셋

GPT-5.4 단계별 추론 데이터셋

undefined

글로벌 기후 및 에너지 전환 2000-2026 글로벌 기후 및 에너지 데이터 세트