Command Palette
Search for a command to run...
VisCoR-55K 시각적 추론 데이터셋
VisCoR-55K는 화중과학기술대학교와 알리바바 클라우드가 협력하여 2026년에 공개한 고품질 시각 추론 데이터셋입니다. 이 데이터셋은 약 55,000개의 시각 추론 샘플로 구성되어 있으며, 각 샘플은 비교 샘플을 사용하여 해당 추론 과정을 생성합니다. VisCoR-55K는 일반, 추론, 수학, 그래프, OCR 등 5가지 주요 범주의 고품질 시각 추론 데이터셋을 포괄하며, 시각 언어 모델을 활용한 신뢰할 수 있고 견고한 시각 추론 연구를 촉진하는 것을 목표로 합니다. 데이터 세트 구성 – VQA 샘플: 독창적인 시각적 질문 답변 샘플 – 대조적인 대응물: 논리적 추론을 유도하기 위해 질문과 답변을 짝지어 제시하는 방식. – 생성된 추론 근거: VC-STaR 프레임워크를 사용하여 합성된 고품질 추론 체인

소환
@inproceedings{pan2026through,
title={Through the Lens of Contrast: Self-Improving Visual Reasoning in VLMs},
author={Pan, Zhiyu and Wu, Yizheng and Hua, Jiasheng and Feng, Junyi and Yan, Shaotian and Deng, Bing and Cao, Zhiguo and Ye, Jieping},
booktitle={The Fourteenth International Conference on Learning Representations},
year={2026}
}