HyperAIHyperAI

Command Palette

Search for a command to run...

VisCoR-55K 시각적 추론 데이터셋

날짜

8시간 전

조직

Alibaba Group
华中科技大学

라이선스

MIT

VisCoR-55K는 화중과학기술대학교와 알리바바 클라우드가 협력하여 2026년에 공개한 고품질 시각 추론 데이터셋입니다. 이 데이터셋은 약 55,000개의 시각 추론 샘플로 구성되어 있으며, 각 샘플은 비교 샘플을 사용하여 해당 추론 과정을 생성합니다. VisCoR-55K는 일반, 추론, 수학, 그래프, OCR 등 5가지 주요 범주의 고품질 시각 추론 데이터셋을 포괄하며, 시각 언어 모델을 활용한 신뢰할 수 있고 견고한 시각 추론 연구를 촉진하는 것을 목표로 합니다. 데이터 세트 구성 – VQA 샘플: 독창적인 시각적 질문 답변 샘플 – 대조적인 대응물: 논리적 추론을 유도하기 위해 질문과 답변을 짝지어 제시하는 방식. – 생성된 추론 근거: VC-STaR 프레임워크를 사용하여 합성된 고품질 추론 체인

데이터 세트 예제
데이터 세트 예제

소환

@inproceedings{pan2026through,
title={Through the Lens of Contrast: Self-Improving Visual Reasoning in VLMs},
author={Pan, Zhiyu and Wu, Yizheng and Hua, Jiasheng and Feng, Junyi and Yan, Shaotian and Deng, Bing and Cao, Zhiguo and Ye, Jieping},
booktitle={The Fourteenth International Conference on Learning Representations},
year={2026}
}

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp